2月11日,一項(xiàng)“AI+醫(yī)療”成果登上頂級(jí)醫(yī)學(xué)科研期刊《Nature Medicine》,該成果基于機(jī)器學(xué)習(xí)的自然語(yǔ)言處理(NLP)技術(shù),實(shí)現(xiàn)評(píng)估和準(zhǔn)確診斷兒科疾病。廣州市婦女兒童醫(yī)療中心、依圖醫(yī)療、美國(guó)加州大學(xué)圣迭戈分校等團(tuán)隊(duì)和機(jī)構(gòu)參與了此次研究。

據(jù)介紹,這是全球首次在頂級(jí)醫(yī)學(xué)雜志發(fā)表有關(guān)自然語(yǔ)言處理(NLP)技術(shù)基于電子健康記錄(EHR)做臨床智能診斷的研究成果。論文標(biāo)題名為“Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence”(《使用人工智能評(píng)估和準(zhǔn)確診斷兒科疾病》)。

AI可準(zhǔn)確診斷常見(jiàn)兒童疾病 ,中國(guó)團(tuán)隊(duì)成果登上Nature子刊-肽度TIMEDOO

一直以來(lái),盡管機(jī)器學(xué)習(xí)在影像診斷方面表現(xiàn)強(qiáng)勢(shì),但在數(shù)量巨大、多樣的電子病歷數(shù)據(jù)分析方面,仍面臨巨大挑戰(zhàn)。電子病歷的數(shù)據(jù)信息之廣、數(shù)據(jù)類(lèi)型之多,以及某些方面的數(shù)據(jù)貧乏及可能出現(xiàn)的特殊案例等,都導(dǎo)致機(jī)器學(xué)習(xí)難以進(jìn)行精確的數(shù)據(jù)分析,并進(jìn)而形成預(yù)測(cè)臨床檢測(cè)的數(shù)據(jù)模型。

AI可準(zhǔn)確診斷常見(jiàn)兒童疾病 ,中國(guó)團(tuán)隊(duì)成果登上Nature子刊-肽度TIMEDOO

圖丨人工智能系統(tǒng)診斷兒科疾病流程圖(來(lái)源:本篇論文)

據(jù)依圖介紹,這一次,團(tuán)隊(duì)提出并測(cè)試了一個(gè)專(zhuān)門(mén)對(duì)電子醫(yī)學(xué)病例進(jìn)行數(shù)據(jù)挖掘的系統(tǒng)框架,將醫(yī)學(xué)知識(shí)和數(shù)據(jù)驅(qū)動(dòng)模型結(jié)合在一起。該模型先通過(guò)NLP對(duì)電子病例進(jìn)行標(biāo)注,利用邏輯回歸來(lái)建立層次診斷,在常見(jiàn)兒童疾病方面的綜合診斷準(zhǔn)確率優(yōu)于相對(duì)低年資兒科醫(yī)生(3年+8年臨床經(jīng)驗(yàn))。

相比以往模型,此次研究使用了超過(guò)140萬(wàn)的龐大數(shù)據(jù),以完善診斷系統(tǒng),使用數(shù)據(jù)在表達(dá)和描述上的一致性,極大的提高了數(shù)據(jù)質(zhì)量。此次研究還基于NLP實(shí)現(xiàn)了病歷的重新格式化:有超過(guò)25年臨床實(shí)踐經(jīng)驗(yàn)的資深主治醫(yī)師手動(dòng)注釋了6,183個(gè)圖表,然后用3,564張人工標(biāo)注的圖表對(duì)NLP信息提取模型進(jìn)行訓(xùn)練,并用剩下的2,619張圖表對(duì)模型進(jìn)行驗(yàn)證。該NLP模型總結(jié)了代表臨床數(shù)據(jù)的關(guān)鍵概念類(lèi)別,利用深度學(xué)習(xí)技術(shù)自動(dòng)將EHR注釋到標(biāo)準(zhǔn)化詞匯和臨床特征中,從而允許對(duì)診斷分類(lèi)進(jìn)行進(jìn)一步處理。

從數(shù)據(jù)來(lái)看,以呼吸系統(tǒng)疾病為例,模型對(duì)上呼吸道疾病和下呼吸道疾病的診斷準(zhǔn)確率分別為89%和87%,而在上呼吸道疾病診斷中,急性喉炎和鼻竇炎的準(zhǔn)確率分別高達(dá)86%和96%,對(duì)不同類(lèi)型哮喘的診斷準(zhǔn)確率從83%到97%。同時(shí)對(duì)普通系統(tǒng)性疾病以及危險(xiǎn)程度更高的疾病也有很高的診斷準(zhǔn)確率,例如傳染性單核細(xì)胞增多癥(90%)、水痘(93%)、玫瑰疹(93%)、流感(94%)、手足口?。?7%)和細(xì)菌性腦膜炎(93%)。也就是說(shuō),該系統(tǒng)可以根據(jù)NLP系統(tǒng)注釋的臨床數(shù)據(jù)信息對(duì)兒科疾病做出準(zhǔn)確的判斷。

AI可準(zhǔn)確診斷常見(jiàn)兒童疾病 ,中國(guó)團(tuán)隊(duì)成果登上Nature子刊-肽度TIMEDOO

圖丨人工智能系統(tǒng)和醫(yī)療團(tuán)隊(duì)在兒科疾病診斷水平的比較(來(lái)源:本篇論文)

此次研究的一大亮點(diǎn),還在于其具備極強(qiáng)的多場(chǎng)景應(yīng)用能力。例如在分診環(huán)節(jié),通過(guò)記錄基礎(chǔ)數(shù)據(jù)讓模型產(chǎn)生預(yù)測(cè)診療結(jié)果,并通過(guò)這個(gè)結(jié)果評(píng)估病人的優(yōu)先級(jí),以確保醫(yī)生可以按需就診?;贏I的診斷模型還可以幫助醫(yī)生診斷復(fù)雜或罕見(jiàn)病癥,提示可能情況,避免由于醫(yī)生受限于自身專(zhuān)業(yè)或經(jīng)驗(yàn),在復(fù)雜病癥出現(xiàn)時(shí)出現(xiàn)誤診。

此外,基于 EHR 構(gòu)建的高質(zhì)量智能病種庫(kù),還可打破原有信息化系統(tǒng)的界限,便于更多的科研項(xiàng)目和業(yè)務(wù)領(lǐng)域高效地使用,優(yōu)化臨床數(shù)據(jù)的獲取鏈路,以及打造更具價(jià)值的診斷系統(tǒng),提升臨床診療的效率。

毫無(wú)疑問(wèn)的是,在大數(shù)據(jù)時(shí)代,醫(yī)療信息正變得越來(lái)越復(fù)雜。近年來(lái),疾病實(shí)體、診斷測(cè)試和生物標(biāo)志物以及治療方式的范圍呈指數(shù)級(jí)增長(zhǎng),臨床決策也變得更加復(fù)雜,需要大量數(shù)據(jù)點(diǎn)的綜合。在當(dāng)前的數(shù)字時(shí)代,EHR代表了大量的電子數(shù)據(jù)點(diǎn)存儲(chǔ)庫(kù),這些數(shù)據(jù)點(diǎn)代表了各種各樣的臨床信息。人工智能方法已經(jīng)成為挖掘EHR數(shù)據(jù)的潛在強(qiáng)大工具,以幫助疾病診斷和管理,模仿甚至可能增強(qiáng)人類(lèi)醫(yī)生的臨床決策。

作為Nature雜志專(zhuān)注于生物醫(yī)學(xué)領(lǐng)域的專(zhuān)業(yè)子刊,Nature Medicine注重基礎(chǔ)研究和涵蓋醫(yī)學(xué)各方面的早期臨床研究,高度關(guān)注人工智能技術(shù)對(duì)醫(yī)療行業(yè)帶來(lái)的巨大革新作用。在2019年1月刊中,Nature Medicine曾發(fā)表9篇論文聚焦AI醫(yī)療,相信未來(lái)還會(huì)有更多人工智能在醫(yī)療行業(yè)深度落地的案例出現(xiàn)。

來(lái)源:麻省理工科技評(píng)論