深圳先進(jìn)院實(shí)現(xiàn)醫(yī)學(xué)數(shù)據(jù)在生物DNA分子中存儲
5月29日,中國科學(xué)院深圳先進(jìn)技術(shù)研究院研究員姜青山、高級工程師黃小羅、中國農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所戴俊彪研究員等聯(lián)合在Small Methods發(fā)表最新研究成果。
研究人員設(shè)計(jì)了一種名為”EDS”的DNA存儲方法,通過改進(jìn)編碼模型、引入冗余核苷酸和設(shè)計(jì)索引技術(shù),實(shí)現(xiàn)了醫(yī)學(xué)磁共振成像(MRI)數(shù)據(jù)的可靠歸檔和檢索。
醫(yī)學(xué)MRI數(shù)據(jù)是診斷、治療規(guī)劃和疾病監(jiān)測等多種領(lǐng)域的重要工具。利用DNA存儲技術(shù)保存醫(yī)學(xué)MRI數(shù)據(jù)將有助于人類健康管理。通過DNA存儲,可以確保這些重要數(shù)據(jù)在數(shù)千年內(nèi)安全保存并精確恢復(fù),從而保證了這些重要數(shù)據(jù)的長期存儲,為研究疾病進(jìn)展和治療效果提供了重要數(shù)據(jù)支撐。
該工作中,研究團(tuán)隊(duì)通過三個(gè)關(guān)鍵組成部分實(shí)現(xiàn)了醫(yī)學(xué)MRI數(shù)據(jù)的歸檔。首先,研究團(tuán)隊(duì)設(shè)計(jì)了一種新穎的分塊策略,解決了旋轉(zhuǎn)編碼導(dǎo)致的數(shù)據(jù)丟失問題。其次,提出了一種基于規(guī)則的四進(jìn)制轉(zhuǎn)碼方法,滿足生化約束條件并確??煽康臄?shù)據(jù)映射。最后,設(shè)計(jì)了一種索引技術(shù),克服了DNA文件存儲中高額外開銷的挑戰(zhàn),旨在簡化DNA文件存儲的組織結(jié)構(gòu),實(shí)現(xiàn)靈活的隨機(jī)搜索、訪問和文件管理。
此外,研究人員在計(jì)算時(shí)間上也提出了新的方法,通過利用多進(jìn)程技術(shù)優(yōu)化DNA存儲編碼流程。他們將編碼任務(wù)分解成多個(gè)子任務(wù),并分配多個(gè)CPU進(jìn)行并行計(jì)算,提高了編碼速率。研究團(tuán)隊(duì)共測試了72GB的人體磁共振成像數(shù)據(jù),僅用9個(gè)小時(shí)便完成了編碼,編碼時(shí)間效率提升明顯,基于數(shù)據(jù)預(yù)測,1TB量級的數(shù)據(jù)可以在120小時(shí)完成。
驗(yàn)證結(jié)果發(fā)現(xiàn),EDS方法在醫(yī)學(xué)MRI數(shù)據(jù)存儲方面表現(xiàn)出色,并且具有更好的生化約束控制和較短的計(jì)算時(shí)間,為醫(yī)學(xué)MRI數(shù)據(jù)的DNA存儲開辟了新的途徑。
這項(xiàng)研究成果為醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)存儲和檢索提供了新的可能性,具有重要的實(shí)際應(yīng)用前景。隨著進(jìn)一步的研究和發(fā)展,DNA存儲技術(shù)有望成為醫(yī)學(xué)數(shù)據(jù)管理的重要工具,為醫(yī)學(xué)健康領(lǐng)域帶來更多的創(chuàng)新和進(jìn)步。
“下一步,我們將進(jìn)一步深化DNA存儲核心技術(shù)研發(fā),包括新一代數(shù)據(jù)存儲芯片等,同時(shí)推動DNA存儲與傳統(tǒng)存儲工具,如磁帶、光盤等結(jié)合,為更多的數(shù)據(jù)存儲應(yīng)用,包括科研機(jī)構(gòu)和企業(yè)的檔案電子化數(shù)據(jù)DNA存儲等提供技術(shù)基礎(chǔ),加快DNA存儲面向?qū)嶋H應(yīng)用的產(chǎn)業(yè)化進(jìn)程?!闭撐墓餐ㄓ嵶髡呓嗌奖硎?。
相關(guān)論文信息:https://doi.org/10.1002/smtd.202301585
來源:《小方法》

