英偉達(dá)與華大基因合作,使用 CUDA 進(jìn)行全基因組測(cè)序-肽度TIMEDOO

12月18日,GTC 2019大會(huì)在蘇州舉行。在長(zhǎng)達(dá)兩個(gè)小時(shí)的大會(huì)上,英偉達(dá)CEO黃仁勛帶來了AI框架、開發(fā)工具、數(shù)據(jù)科學(xué)、云計(jì)算、實(shí)時(shí)渲染以及 5G 等等方面的新動(dòng)作。而在垂直領(lǐng)域,黃仁勛則表示,從運(yùn)輸、醫(yī)療、金融到零售,各行各業(yè)都在爭(zhēng)相利用AI的自動(dòng)化能力。

今年,英偉達(dá)為CUDA增加了兩個(gè)新的主流應(yīng)用——5G vRAN和基因組處理,基因組行業(yè)的華大基因?qū)?yīng)用實(shí)現(xiàn)了支持。

據(jù)雷鋒網(wǎng)了解,華大基因的生命科學(xué)超級(jí)計(jì)算機(jī)以每天60個(gè)基因組的吞吐量,改變了全基因組測(cè)序(WGS:Whole Genome Sequencing),并同時(shí)降低了成本。

全基因組測(cè)序會(huì)分析整個(gè)基因序列,可以檢測(cè)由遺傳性疾病引起的DNA突變,突變導(dǎo)致的癌癥擴(kuò)散,或是追蹤基因突變引發(fā)疾病的機(jī)制。

同時(shí)這項(xiàng)技術(shù)也用于研究畜牧業(yè)、農(nóng)特和導(dǎo)致疾病的微生物。

但是,如何解決大數(shù)據(jù)存取能力以及計(jì)算能力不足等瓶頸問題,是基因組學(xué)研究和應(yīng)用面臨的一大難題?;蚪M處理流程在行業(yè)標(biāo)準(zhǔn)中被稱為GATK,這一過程可根據(jù)參考繪制DNA短鏈,以重建基因組并找出變異,屬于計(jì)算密集型任務(wù)。

英偉達(dá)與華大基因合作,使用 CUDA 進(jìn)行全基因組測(cè)序-肽度TIMEDOO

現(xiàn)場(chǎng),黃仁勛發(fā)布NVIDIA Parabricks基因組分析工具包,Parabricks是一個(gè)基于CUDA加速的基因組處理工具包,可以用于發(fā)現(xiàn)變異,并能產(chǎn)生與GATK最佳實(shí)踐流程一致的結(jié)果,實(shí)現(xiàn)30-50倍的加速。

Parabricks提供了DeepVariant工具,利用深度學(xué)習(xí)技術(shù)進(jìn)行基因變異檢測(cè)?,F(xiàn)在,華大基因就采用了Parabricks。借助若干GPU服務(wù)器,華大基因可以按照測(cè)序儀生成數(shù)據(jù)的速率來處理基因組。

當(dāng)然,除了發(fā)布會(huì)上推出的工具包,2018年11月,英偉達(dá)還推出了專門針對(duì)醫(yī)療影像的超算平臺(tái)Clara,讓開發(fā)人員通過開發(fā)各種應(yīng)用程序來處理現(xiàn)有數(shù)據(jù) 。但是,在今天的發(fā)布會(huì)上,黃仁勛并沒有現(xiàn)場(chǎng)展示CLARA的相關(guān)內(nèi)容。

對(duì)此,在接受采訪時(shí),黃仁勛開玩笑說,發(fā)布會(huì)只有短短的兩個(gè)小時(shí),他無法將所有的東西都展示出來。但是他特別提及了聯(lián)邦學(xué)習(xí),他表示,很多公司都希望利用這種方法去解決數(shù)據(jù)隱私問題?!笆聦?shí)上,上午我們展示聯(lián)邦學(xué)習(xí)技術(shù)在自動(dòng)駕駛上的應(yīng)用,在醫(yī)學(xué)影像上也是共通的。英偉達(dá)提供的 Drive Federated Server Global Model 可以提供給每個(gè) OEM 廠商使用,結(jié)合各自的數(shù)據(jù),幫助各個(gè)廠商提升彼此的模型?!?/span>

此前,英偉達(dá)醫(yī)療副總裁Kimberly Powell曾向雷鋒網(wǎng)表示,醫(yī)療領(lǐng)域是英偉達(dá)規(guī)模最大、也是最為成熟的一個(gè)領(lǐng)域。而英偉達(dá)更多的是扮演一個(gè)“賦能者”的角色,為整個(gè)AI生態(tài)系統(tǒng)打造了一個(gè)完善的開發(fā)工具,幫助創(chuàng)業(yè)公司更好地執(zhí)行醫(yī)療AI的應(yīng)用。

來源:雷鋒網(wǎng)