美國發(fā)布最全冠狀病毒論文數(shù)據(jù)庫,可助科研人員快速梳理文獻(xiàn)
現(xiàn)在,只要登錄一個網(wǎng)站,你就可以獲取超過24000份關(guān)于冠狀病毒的研究文獻(xiàn)。這對于正在研究新冠病毒的科學(xué)家來說,是一個省事又省力的好工具。
當(dāng)?shù)貢r間3月16日,美國多家研究組織人員聯(lián)合發(fā)布了關(guān)于冠狀病毒的開放研究數(shù)據(jù)庫,該數(shù)據(jù)庫的論文來自同行評審期刊,非同行評審的預(yù)印本論文網(wǎng)站bioRxiv和medRxiv等。目前,這個數(shù)據(jù)庫涵蓋了SARS-CoV-2(新冠病毒),Covid-19(該疾病的科學(xué)名稱)和冠狀病毒組等多方面內(nèi)容。也就是說,這個數(shù)據(jù)庫幾乎包含了與新冠病毒相關(guān)的最全科學(xué)文獻(xiàn)。同時,這個數(shù)據(jù)集還能實(shí)時更新,發(fā)布更多的研究論文。
據(jù)了解,該數(shù)據(jù)庫是在美國白宮科學(xué)技術(shù)政策辦公室(OSTP)的要求下,通過三個組織之間協(xié)作而完成的。其中,美國國立衛(wèi)生研究院的國立醫(yī)學(xué)圖書館(NLM)提供了對現(xiàn)有科學(xué)出版物的訪問權(quán)限;微軟則利用其文獻(xiàn)策劃算法來幫助查找相關(guān)論文;非營利組織艾倫人工智能研究所(AI2)提供了可將研究論文從網(wǎng)頁轉(zhuǎn)換為PDF格式的算法處理能力。目前,該數(shù)據(jù)庫可以在AI2的Semantic Scholar網(wǎng)站上找到。
Semantic scholar跟谷歌學(xué)術(shù)搜索功能類似。它是AI2結(jié)合了自然語言處理和計(jì)算機(jī)視覺的新學(xué)術(shù)搜索引擎。但相比谷歌學(xué)術(shù)搜索,Semantic Scholar更加精確,簡潔明了,它的搜索結(jié)果會顯示關(guān)鍵信息,例如作者,方法,數(shù)據(jù)和引文,使科學(xué)家可以更輕松地快速評估每篇論文。
值得一提的是,AI2還使用ELMo和BERT等最新的自然語言模型來描述論文之間的相似性。同時,該數(shù)據(jù)庫還有一項(xiàng)新功能,可以幫助研究人員,根據(jù)自己的興趣創(chuàng)建個性化的研究摘要。
對于科學(xué)家來說,他們正在爭分奪秒地研究新冠病毒,以期找到阻止其傳播的方法和治療方法。有了這個數(shù)據(jù)庫后,所有研究文獻(xiàn)將集合在一處,可以讓研究人員利用自然語言處理算法更輕松地挖掘文獻(xiàn)資料。 OSTP也公開呼吁人工智能的研究人員開發(fā)用于文本和數(shù)據(jù)挖掘的新技術(shù),稱這將幫助醫(yī)學(xué)界更快地梳理大量的研究信息。
來源:澎湃新聞


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。