人工智能篩出關(guān)鍵蛋白 可鑒別甲狀腺結(jié)節(jié)的良與惡
將蛋白質(zhì)組大數(shù)據(jù)與人工智能相結(jié)合,致力于開發(fā)基于蛋白質(zhì)組和其他分子組學的輔助臨床診斷新方法,以期實現(xiàn)腫瘤等人類重大疾病的精準輔助診斷……由西湖大學郭天南實驗室提供核心技術(shù),近日,西湖歐米(杭州)生物科技有限公司獲得數(shù)千萬元種子輪融資。
據(jù)了解,西湖歐米有望實現(xiàn)臨床轉(zhuǎn)化的首個項目,是基于蛋白質(zhì)標志物的甲狀腺結(jié)節(jié)的良惡性診斷。
西湖大學生命科學學院特聘研究員郭天南介紹道,蛋白質(zhì)組學是繼基因組學、轉(zhuǎn)錄組學后人類對生命活動奧秘探究的又一突破。人類的幾乎所有生命活動都是由人體內(nèi)的蛋白質(zhì)執(zhí)行的,疾病治療的效果也取決于蛋白質(zhì)機器的調(diào)控。蛋白質(zhì)組學+AI技術(shù)的運用場景,將遠不止于甲狀腺結(jié)節(jié)。
為蛋白質(zhì)稱重 捕捉細微變化
人們在吞咽的時候,頸部隨著吞咽動作上下活動的器官即甲狀腺。甲狀腺雖小,一發(fā)生病變或?qū)⑿纬杉谞钕俳Y(jié)節(jié),導致頸部有腫物、疼痛以及甲狀腺功能減退癥。
早在2010年,中華醫(yī)學會內(nèi)分泌學分會曾公布中國首次十城市社區(qū)居民的甲狀腺疾病流行病學調(diào)查結(jié)果,顯示居民甲狀腺結(jié)節(jié)患病率為18.6%。
“按此估測,如今每5個成年人中就可能有1人患有甲狀腺結(jié)節(jié)?!惫炷辖榻B,相關(guān)臨床調(diào)查顯示,約有60%的甲狀腺結(jié)節(jié)呈良性,10%呈惡性,剩下約30%,無論通過血液檢測、B超、CT還是甲狀腺組織穿刺活檢,均難以辨別良性還是惡性。
“治療甲狀腺結(jié)節(jié),很多人不得不選擇切除甲狀腺,代價是終身服藥補充甲狀腺素,以維持體內(nèi)的甲狀腺激素在正常水平。但其中相當一部分人,患有的實際上為良性結(jié)節(jié)。”郭天南表示,科學家們曾寄希望于基因檢測,來解決這一難題,但經(jīng)過十幾年的嘗試發(fā)現(xiàn),基因診斷能夠達到的特異性也僅在10%~50%左右,主要是因為甲狀腺結(jié)節(jié)惡性程度低等原因,基因水平上的改變并不頻繁、也不明顯。
據(jù)介紹,一個人從生到死,從健康到疾病,絕大多數(shù)情況下基因都是不變的。但在不同健康狀態(tài)下,人體內(nèi)的蛋白質(zhì)會發(fā)生變化。郭天南實驗室選擇從“蛋白質(zhì)”入手,開展診斷疾病的技術(shù)研究。難點在于,這種變化非常細微,怎么才能檢測到?
郭天南說,所有的蛋白質(zhì),即使肉眼能看到,因其復雜的結(jié)構(gòu)也很難準確辨識。“我們通過測量它的重量,來鑒定、區(qū)分不同的蛋白質(zhì)。蛋白質(zhì)稱重的這桿‘秤’叫質(zhì)譜儀,我們使用的質(zhì)譜儀可以達到約小數(shù)點后30位(kg)的精度?!?/p>
“將蛋白質(zhì)稱重是第一步,還不足以實現(xiàn)對甲狀腺結(jié)節(jié)的良惡性辨別。兩種蛋白質(zhì)的差別是由質(zhì)譜數(shù)據(jù)中眾多因素的復雜關(guān)系所決定的,是一個模式識別問題?!蔽骱髮W工學院李子青教授強調(diào)。
研究團隊構(gòu)建算法模型將2622個蛋白質(zhì)組學數(shù)據(jù)進行了約2的1019次方的運算,再將篩選的20個關(guān)鍵蛋白進行良惡性的打分。受訪者供圖
設(shè)置算法評分? 準確率達89%
在西湖大學工學院李子青教授看來,從甲狀腺結(jié)節(jié)質(zhì)譜大數(shù)據(jù)中鑒別其良惡性,就像從一張圖像中辨識 “兩張”長像類似的人臉。
他帶領(lǐng)研究團隊采用機器學習的方法,從原始質(zhì)譜數(shù)據(jù)中選擇出2622個有意義的候選特征蛋白質(zhì),并通過神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建了一套適用于蛋白質(zhì)組學數(shù)據(jù)的獨特算法模型,將2622個蛋白質(zhì)組學數(shù)據(jù)輸入了這個模型,進行了大約2的1019次方的運算,終于找出了能夠幫助醫(yī)生辨別患者結(jié)節(jié)良惡性的20個關(guān)鍵蛋白。
李子青介紹,用這套模型,研究人員給這20個蛋白的總體情況打分(分值在0-1之間):當綜合得分大于等于0.5,即為惡性結(jié)節(jié);小于0.5,就是良性結(jié)節(jié)。臨床試驗顯示,這種檢測方法的綜合準確率達到了89%。
“這項技術(shù)還可以用來篩選治療腫瘤的藥物?!惫炷险f,電影《我不是藥神》提到白血病中有一類叫慢性髓系白血病,幾乎90%的這類患者體內(nèi)都會出現(xiàn)一個特殊的融合蛋白BCR-ABL,科學家找到“伊馬替尼”這種藥,可以有效抑制這個融合蛋白的功能,有效率可以達到90%以上。
郭天南說,研究表明,每個腫瘤都可能有一個或多個這樣的引起疾病的異常蛋白,并且還可能隨著疾病的演進出現(xiàn)改變。如果能通過蛋白質(zhì)組學+AI技術(shù),實時找到當前疾病階段的異常蛋白,就能實現(xiàn)“對癥下藥”。相信隨著分子醫(yī)學、大數(shù)據(jù)技術(shù)和人工智能的快速發(fā)展,蛋白質(zhì)組學在精準醫(yī)療領(lǐng)域?qū)⒄故境鲈絹碓酱蟮膽?yīng)用潛力。
來源: 科技日報

