美國(guó)梅奧診所:AI指出腹瀉是新冠病毒的主要早期癥狀
在新型冠狀病毒疫情蔓延全球之際,科學(xué)家們除了從生物學(xué)和化學(xué)的角度尋找解決辦法,還嘗試?yán)每萍嫉牧α颗c之對(duì)抗。通過大數(shù)據(jù)資料,很多科技公司開發(fā)了追蹤感染者活動(dòng)路徑的應(yīng)用,從而幫助當(dāng)?shù)匦l(wèi)生機(jī)構(gòu)更全面地掌握疫情的傳播范圍。
另一方面,為了利用現(xiàn)有資料進(jìn)一步提高病毒檢測(cè)效率,一些工程師和科學(xué)家將目光聚焦在了人工智能上(AI),寄希望于它善于尋找規(guī)律的特長(zhǎng),期待在茫茫多的臨床數(shù)據(jù)中挖掘出人們尚未發(fā)現(xiàn)的重要信息。
近日,一份發(fā)表于 Arxiv 的預(yù)印本論文闡述了如何利用 AI 識(shí)別和分析冠狀病毒感染的臨床特征。研究團(tuán)隊(duì)成員來自于美國(guó)知名醫(yī)療機(jī)構(gòu) Mayo Clinic(梅奧診所)和醫(yī)療數(shù)據(jù)分析初創(chuàng)公司 Nference。
論文指出,通過 AI 分析 800 多萬份臨床數(shù)據(jù)后發(fā)現(xiàn),腹瀉是最值得關(guān)注的早期癥狀之一。在測(cè)試 4-7 天前,絕大多數(shù)患者會(huì)同時(shí)出現(xiàn)咳嗽和腹瀉癥狀,伴隨著味覺或嗅覺喪失和大量出汗。這些綜合起來組成了新冠肺炎最早期的癥狀清單。
圖 | 梅奧診所
雖然新冠病患出現(xiàn)上述癥狀早已為人所知,但研究人員表示,通過技術(shù)手段(神經(jīng)網(wǎng)絡(luò))整理和分析海量數(shù)據(jù),可以加深人們對(duì)癥狀的理解,不僅可以驗(yàn)證現(xiàn)行觀點(diǎn)的準(zhǔn)確性和科學(xué)性,也有助于早期病例的自我發(fā)現(xiàn)、篩查和分類,實(shí)現(xiàn)早發(fā)現(xiàn)早治療,有效減輕醫(yī)療系統(tǒng)的負(fù)擔(dān)。
為了訓(xùn)練 AI 系統(tǒng),梅奧診所提供了近 823 萬份電子病歷版臨床記錄,囊括了 14967 名接受了 PCR 檢測(cè)(聚合酶鏈?zhǔn)椒磻?yīng)檢測(cè))的測(cè)試者信息,其中有 272 名患者確認(rèn)感染了新冠病毒。
電子病歷詳細(xì)記錄了每名測(cè)試者的癥狀資料,比如腹瀉、頭痛、發(fā)燒、乏力、味覺或嗅覺喪失等等,時(shí)間跨越測(cè)試前數(shù)周到測(cè)試后數(shù)周。為了讓分析結(jié)果更有說服力,研究人員只使用了最早追溯到測(cè)試前 7 天的癥狀,并且大致分為腸胃類、呼吸類和感官類特征。
研究中所使用的 AI 并非專門針對(duì)疾病診斷的系統(tǒng),而是基于谷歌 AI 開源的 BERT 模型,專門用于自然語言處理(NLP)。原因是其性能強(qiáng)大且無需太多改動(dòng),能夠直接提取電子病歷中的海量數(shù)據(jù),以關(guān)鍵詞的方式加以分析和歸類。
研究人員通過該模型實(shí)現(xiàn)了疾病、藥物、癥狀和其他關(guān)鍵詞的自動(dòng)識(shí)別和提取,量化各個(gè)關(guān)鍵詞與上下文的關(guān)聯(lián)強(qiáng)度,然后將每一種聯(lián)系分類為 “正面” “負(fù)面” 或者“其他”。
針對(duì)不同人對(duì)類似癥狀的表述方式不同,他們會(huì)讓 AI 系統(tǒng)做出綜合整理。以關(guān)鍵癥狀 “胸痛” 為例,AI 會(huì)自動(dòng)將病歷中的 “胸痛” 類詞匯整合起來,諸如 “胸悶” “胸口疼” “胸口堵塞” 和“胸口不舒服”等詞匯都會(huì)被歸為 “胸痛” 類別。
圖 | 部分早期癥狀在陽性和陰性測(cè)試者中的比例(來源:Mayo Clinic)
最終,AI 系統(tǒng)提取出的信息顯示,在接受 PCR 測(cè)試前一周內(nèi),有 43 名新冠病毒陽性患者出現(xiàn)過腹瀉癥狀,占總陽性人數(shù)的 15.8%,而相對(duì)的,只有 5.6% 的陰性測(cè)試者聲稱有過腹瀉。兩者相差近三倍。
在 272 名確診患者中,約有 3% 的人出現(xiàn)了嗅覺或味覺失靈,雖然比例不大,但這種情況幾乎不會(huì)在正常人或陰性測(cè)試者身上出現(xiàn),因此比咳嗽和發(fā)燒等癥狀更具代表性。
另外,確診患者出現(xiàn)過度出汗、疲勞和頭痛的比例分別是 11.4%、13.6% 和 12.9%,也明顯高于陰性測(cè)試者。但較為常見的咳嗽和發(fā)燒癥狀,在測(cè)試者身上的對(duì)比似乎并不是太明顯:約有 25% 的陽性患者稱自己出現(xiàn)上述癥狀,而陰性測(cè)試者中,也有 19% 的人聲稱自己同樣出現(xiàn)了上述癥狀。
這可能是因?yàn)榘Y狀較為常見,容易出現(xiàn)主觀認(rèn)知偏差。
在進(jìn)一步分析數(shù)據(jù)之間的關(guān)聯(lián)后,研究人員發(fā)現(xiàn),有兩種癥狀組合最值得關(guān)注:咳嗽 & 腹瀉和盜汗 & 腹瀉。它們同時(shí)出現(xiàn)時(shí)與陽性患者的關(guān)聯(lián)最為緊密。
數(shù)據(jù)顯示,約有 13.2% 的陽性病例同時(shí)出現(xiàn)了咳嗽和腹瀉,比例是陰性病例的 4 倍。而同時(shí)出現(xiàn)盜汗和腹瀉的陽性病例有 21 例,占比 7.7%,是陰性病例的 5.5 倍。
相比單一表現(xiàn),組合癥狀與陽性病例的關(guān)聯(lián)性更值得注意,而腹瀉不僅本身具有獨(dú)特性,又是兩種組合的共同點(diǎn),說明它很可能具備重點(diǎn)關(guān)注的價(jià)值,與新冠病毒的關(guān)聯(lián)性值得挖掘。
不過研究人員也指出,這項(xiàng)研究的核心是提取電子病例數(shù)據(jù)進(jìn)行分析,因此受患者主觀表述的影響較大。例如無癥狀患者的一些輕度癥狀可能不會(huì)報(bào)告給醫(yī)生,沒有記錄在病歷中,或者主觀認(rèn)定某種癥狀出現(xiàn)過,但實(shí)際上并沒有,導(dǎo)致分析結(jié)果出現(xiàn)偏差。
“我們分析電子病歷得來的成果能夠幫助病理學(xué)研究。針對(duì)新冠病毒的高靈敏度和高特異性血清測(cè)試(抗體測(cè)試)正在逐漸成熟,人們有望在家中自行測(cè)試,所以捕捉相關(guān)癥狀將變得越來越重要,”研究人員強(qiáng)調(diào),“我們希望類似于這種 AI 系統(tǒng)的,基于電子病歷的數(shù)字醫(yī)療工具可以提供幫助?!?/p>
來源:麻省理工科技評(píng)論


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。