首頁 >國際 >

國內(nèi)首次!AI醫(yī)生與真人醫(yī)生一致性評測,結(jié)果如何?

國內(nèi)首次AI醫(yī)生與真人醫(yī)生一致性評測結(jié)果正式揭曉!6月30日,醫(yī)聯(lián)于成都舉行了國內(nèi)首次AI醫(yī)生與真人醫(yī)生一致性評測,并進行了全天候?qū)崟r直播?,F(xiàn)場有120多位真實患者及10位來自四川大學(xué)華西醫(yī)院的主治醫(yī)師共同參與了這場評測研究。最終,經(jīng)過來自北大人民醫(yī)院、中日友好醫(yī)院、阜外醫(yī)院和友誼醫(yī)院的7位專家教授針對評測形成的91份有效病例進行審核,并且針對AI醫(yī)生的問診準確性、診斷準確性、治療建議準確性、輔助檢查方案準確性、數(shù)據(jù)分析準確性、提供可解釋信息、自然語言問診與交互這7個評價維度的打分之后,最終,真人醫(yī)生綜合得分為 7.5分,AI醫(yī)生綜合得分為7.2分。AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達到了96%。

(最終評審結(jié)果)

國內(nèi)首次AI醫(yī)生一致性評測 評審專家稱“超出預(yù)期”


(資料圖)

在歷經(jīng)8個小時的問診過程中,MedGPT與來自四川大學(xué)華西醫(yī)院的心內(nèi)科、消化內(nèi)科、呼吸內(nèi)科、內(nèi)分泌科、腎臟內(nèi)科、骨科、泌尿外科的10位主治及以上醫(yī)師共同對100余名患者進行問診,經(jīng)過專家評審團,從準確性、客觀數(shù)據(jù)分析、可信度、人機交互性展開。最終,經(jīng)過長達3個小時的對比分析及判斷,綜合專家團所有評審的判定及評分,AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達到了96%。

(評審流程)

為了保證評測的合理性和科學(xué)性,此次測試的問診環(huán)節(jié)進行了特殊的設(shè)計:患者進入診室后,將與醫(yī)助溝通自身病情,醫(yī)助通過線上文字輸入的方式將患者主訴傳達給真人醫(yī)生與AI醫(yī)生并協(xié)助醫(yī)患完成多輪溝通,在收集足夠的決策因子后,真人醫(yī)生與AI醫(yī)生為患者開具檢查單或診斷,患者直接在成都高新海爾森醫(yī)院完成檢查;在獲得檢查結(jié)果后,患者進行復(fù)診,并由AI醫(yī)生及真人醫(yī)生提供臨床診斷及治療方案。通過以上流程,可以在條件基本一致的情況下,讓真人醫(yī)生與AI醫(yī)生進行互不干涉的獨立診斷。

在當晚的評審環(huán)節(jié),現(xiàn)場專家對于AI醫(yī)生的表現(xiàn)給予高度肯定,在場評審團專家普遍認為,MedGPT而是通過多輪詢問收集足夠信息,以確保醫(yī)療準確性為前提推進問診流程,所以出現(xiàn)誤診、漏診的概率就比較小。令人驚喜的一點是,不同于專科醫(yī)生,MedGPT診斷出了不屬于就診科室的疾病,給出其他具備可能性的判斷,這在常規(guī)的??茊栐\中是很難做到的。專家評審團認為,它的知識覆蓋面是超過一些經(jīng)驗并不是很充足的真人醫(yī)生的。

北大人民醫(yī)院主任醫(yī)師薛峰在評審過程中發(fā)現(xiàn)了一個“驚喜”:MedGPT根據(jù)患者腳底板疼痛診斷出有患者有可能出現(xiàn)神經(jīng)壓迫,真人醫(yī)生卻沒有想到這一點。薛峰認為,MedGPT應(yīng)該是一個非常有發(fā)展前景的一項技術(shù),在病人遇到一些癥狀,有困擾的時候,跟他去聊一聊,讓它給一個初步的診斷,還是非常有幫助的,具備非常好的前景。

中日友好醫(yī)院心內(nèi)科主任醫(yī)師任景怡表示:我覺得最好的一點,當診斷尚不明確時,MedGPT并不會輕易給出結(jié)論,而是要堅持要通過繼續(xù)問診或檢查收集更多信息。盡管MedGPT還存在一些問題,但邁出了重要的一步,這是里程碑式的結(jié)果。

云化能力結(jié)合 AI醫(yī)生“手段”更加豐富

值得一提的是,MedGPT不僅在一致性上達到了一定水準,還可以提供疾病治療環(huán)節(jié)中的其他“手段”,例如此次診斷過程中的“云檢驗”:在完成初步問診后,MedGPT會給患者開具必要的醫(yī)學(xué)檢查項目,以進一步明確病情?;颊邉t可以通過醫(yī)聯(lián)云檢驗等多模態(tài)能力進行檢查?;谟行栐\以及醫(yī)學(xué)檢查數(shù)據(jù),MedGPT得以進行準確的疾病診斷,并為患者設(shè)計后續(xù)疾病治療方案。對于真人醫(yī)生來說,開具檢驗并根據(jù)結(jié)果對病情進行判斷是疾病診斷過程中的常規(guī)操作,但對于AI醫(yī)生來說,這是一則突破。

在此次問診現(xiàn)場,MedGPT就為患者開具了多種檢驗檢測,患者在憑借單據(jù)直接在成都高新海爾森醫(yī)院完成相關(guān)檢測。醫(yī)聯(lián)MedGPT項目負責(zé)人王磊表示:MedGPT開單檢查只是多模態(tài)能力的其中一環(huán),MedGPT后續(xù)將配合醫(yī)聯(lián)多種云化能力,覆蓋預(yù)防、診斷、治療、康復(fù)的疾病管理全流程,讓患者輕松接觸到優(yōu)質(zhì)醫(yī)療資源。未來,MedGPT會擁有更大的想象空間。

事實上,醫(yī)聯(lián)在今年5月已經(jīng)公布了MedGPT多種醫(yī)學(xué)檢驗檢測模態(tài)能力。除了配合云化能力進行檢驗檢測外,MedGPT會在患者收到藥品后主動為患者進行用藥指導(dǎo)與管理、智能隨訪復(fù)診、康復(fù)指導(dǎo)等智能化疾病診療動作。醫(yī)聯(lián)MedGPT plugin應(yīng)用平臺整合超過 1000+醫(yī)療多模態(tài)能力,整合多樣化的醫(yī)療多模態(tài)能力,豐富和完善全流程智能化診療體驗。

一次階段性探索 一次AI應(yīng)用發(fā)展的推進

現(xiàn)階段,醫(yī)療行業(yè)還存在著資源分配不均,邊緣地區(qū)患者難以接觸到優(yōu)質(zhì)醫(yī)療資源等痛點,而AI醫(yī)療可以有效補充醫(yī)療資源,助力全民健康生活水平的提升,有利于補全基層診療服務(wù)短板,強化公共衛(wèi)生服務(wù)效率,幫助解決優(yōu)質(zhì)醫(yī)療資源相對匱乏和基層醫(yī)療服務(wù)能力不足的結(jié)構(gòu)性難題。

(評測現(xiàn)場)

此次測試是國內(nèi)首次公開的、規(guī)?;摹⒒谡鎸嵒颊叩腁I醫(yī)生與真人醫(yī)生的一致性研究評測,也是對于AI醫(yī)療的一次階段性探索。經(jīng)過此次評測,以MedGPT為首的AI醫(yī)療已經(jīng)現(xiàn)階段進入到了真實患者測試階段,這也意味著通用型人工智能技術(shù)的研究與應(yīng)用發(fā)展水平得到了進一步推進。王磊表示:“此次測評,本質(zhì)是為了持續(xù)驗證與提升AI模型的醫(yī)學(xué)有效性。醫(yī)聯(lián)希望通過MedGPT在疾病管理全流程上的能力,讓智能化的醫(yī)療手段幫助更多患者,令各地醫(yī)療資源的不均等逐漸消弭?!?/p>

推動AI在醫(yī)療行業(yè)的研究與應(yīng)用,以嚴肅醫(yī)療為根本,讓優(yōu)勢的醫(yī)療資源與技術(shù)惠及更多人,是醫(yī)聯(lián)不斷向前的動力。醫(yī)聯(lián)也將在AI醫(yī)療領(lǐng)域持續(xù)耕耘,加速AI在醫(yī)療行業(yè)內(nèi)的落地應(yīng)用,力爭貫徹讓全人類健康壽命延長一年的使命。

關(guān)鍵詞:

責(zé)任編輯:Rex_03