Science:用于研究語言的算法可預測SARS-CoV-2和其它病毒的“逃逸”突變
通過彌合人類語言和病毒演化間的概念鴻溝,研究人員開發(fā)出了一種功能強大的新型工具,它能用來預測允許病毒“逃脫”人類免疫或疫苗的突變。它的應用可避免目前需要用高通量實驗技術來發(fā)現(xiàn)允許病毒躲避識別的潛在突變。
Yoo-Ah Kim和Teresa Przytycka在相關的《視角》中寫道:“這些作者發(fā)現(xiàn)了病毒及其被宿主免疫系統(tǒng)的解讀與自然語言中的句子及其被人類解讀屬性之間的相似處。”
病毒有時會以旨在令其能逃避人體免疫系統(tǒng)并引起感染的方式突變,它也被稱為病毒逃逸。病毒的這一能力是疫苗和抗病毒藥物開發(fā)中的重大挑戰(zhàn),它尤其體現(xiàn)在創(chuàng)制通用型流感疫苗和HIV有效療法之中。此外,病毒逃逸已迅速成為在爭競SARS-CoV-2感染解決方案中的緊迫問題。
盡管對支配逃逸突變演變規(guī)則的了解可為治療設計提供信息,但目前用于識別潛在逃逸突變的技術仍然有限。受語法(或句法)和含義(或語義)等語言學概念的啟發(fā),Brian Hie和同事應用自然語言處理(最初是為了訓練計算機使用一系列單詞來理解人類語言而開發(fā)的一種機器學習技術)來預測可能導致病毒利用氨基酸序列改變而逃逸的突變。
與單詞更改如何可以令句子保持語法正確但又能改變其含義類似,Hie等人證明,病毒如何能通過保持生物學“句法”正確的突變而實現(xiàn)免疫逃避;該“句法”控制著病毒的感染能力但又改變了病毒的“語義”,從而令中和抗體不再能識別該病毒。
根據(jù)這些結(jié)果,針對甲型流感、HIV-1和SARS-CoV-2蛋白所研發(fā)的不同語言模型可準確預測有因果關系的逃逸突變,確定具高潛力逃逸的結(jié)構區(qū)域。這些模型無需事先培訓且僅用原始序列數(shù)據(jù)就能取得這些結(jié)果。他們發(fā)現(xiàn),對SARS-CoV-2而言,刺突蛋白(即病毒感染細胞所用蛋白)中的逃逸潛能在兩個結(jié)構域中呈顯著富集,但在另一結(jié)構域中卻大量減少。
來源:EurekAlert中文


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。