DNA作為儲存生物信息的結(jié)構,從演化產(chǎn)生以來一直保持著穩(wěn)定、安全的性能。利用4個堿基的組合,它傳遞著一代又一代的遺傳密碼。這種密碼組合的優(yōu)越性如今也被科學家看在眼里,類似計算機中的1和0,他們利用ATCG同樣創(chuàng)造了信息儲存代碼。但是黑客能不能會入侵DNA代碼呢?目前來看,答案同樣是肯定的。

DNA是一種存儲信息的方式,利用ATCG四個堿基,組成了生物體的遺傳信息,引導生物的發(fā)育與生命機能的運轉(zhuǎn)??茖W家們曾經(jīng)利用DNA的信息存儲功能,將書籍、錄音、動圖,甚至是亞馬遜的禮品卡存于其中,跨越了生物與計算機之間的鴻溝。

后來,華盛頓大學信息安全研究人員有了這樣一個想法:如果能將惡意代碼存入DNA,會帶來怎樣的風險?于是,他們進行了一次試驗,他們設計了一段用ATCG編碼的惡意代碼,并成功的在互聯(lián)網(wǎng)上買到了由此代碼合成的DNA,當測序儀對此段DNA進行測序并利用電腦軟件進行數(shù)據(jù)分析時,惡意代碼被啟動并入侵了電腦。

研究人員認為,考慮到現(xiàn)在基因測序的應用領域越來越廣,雖然現(xiàn)在還沒有證據(jù)表明基因測序或者基因數(shù)據(jù)面臨此類安全問題,但是未來,一旦有黑客發(fā)起類似攻擊,將可能竊取大型實驗室的知識產(chǎn)權,污染用于犯罪調(diào)查的DNA分析數(shù)據(jù)。也有可能,企業(yè)可以利用這項應用保護其轉(zhuǎn)基因產(chǎn)品的商業(yè)機密。

從數(shù)字信息到生物信息

從理論上看,將信息存儲在DNA中并不困難。在電腦中,每一個字符都由0、1進行編碼,任何數(shù)字化的內(nèi)容,不管是視頻還是圖片亦或是一段程序,本質(zhì)上都是一串串的0和1。而在生物體中,遺傳信息存儲在DNA中,代碼變成了堿基:A、C、G、T。簡單地說,用DNA存儲數(shù)字信息相當于用A、C、G、T取代了0和1。

2012年,哈佛大學教授、美國基因工程學家喬治·丘奇(George Church)及其團隊在科學期刊Science上發(fā)文,介紹了他們將DNA用作信息存儲媒介,使用DNA微芯片編寫了一本5萬余字的書,制作了54898個DNA序列,利用測序儀就可以閱讀了這本書。在論文中,作者寫道:“DNA是已知最穩(wěn)定和密集的信息媒介之一,隨著DNA合成和測序技術的發(fā)展,DNA將成為越來越可行的存儲媒介。”

2016年,紐約基因組研究中心的研究人員開發(fā)了一套新的編碼系統(tǒng),可以極大地增加DNA分子的數(shù)據(jù)存儲容量,他們將一部電影、一個電腦操作系統(tǒng)、一篇論文、一個電腦病毒以及一張50美元的亞馬遜禮品卡進行“堿基編碼”,產(chǎn)生了一份包含7.2萬個DNA片段的文庫,一家DNA合成公司幫助他們合成了實體DNA。為了再次重現(xiàn)DNA中儲存的數(shù)據(jù),他們對DNA進行了測序,并利用軟件將遺傳信息轉(zhuǎn)化為二進制代碼,幾乎無誤差的,能夠重現(xiàn)所有文件。

2017年,喬治·丘奇等人又在Nature上刊文闡述了他們?nèi)绾卫没蚓庉嫾夹gCRISPR將圖片和短片編碼到了一群活細菌的基因組中。他們所制作的短片有5幀,每一幀,研究人員用104個DNA片段進行編碼。接著,研究人員以每天一幀的速度,將短片的DNA片段植入到大腸桿菌中,5天的時候,將整部短片植入到了大腸桿菌中。之后,研究人員再對大腸桿菌進行測序,即可讀取并還原短片。作者認為,這項研究表明,在活細胞的基因組中可以穩(wěn)定的存儲真實的數(shù)據(jù)。

用DNA藏匿電腦病毒:一次基因測序就劫取機密-肽度TIMEDOO

生物學家們的研究證明,將數(shù)字信息存儲于DNA中,甚至是活細胞的基因組中是可行的,且這些信息可以以較高的精準度還原。而且DNA存儲有一種先天的優(yōu)勢,不需要很苛刻的條件,其中的信息可以保存上百年,如果將其保存在陰涼、干燥的地方,其中的信息甚至可以保存成千上萬年。

大多數(shù)生物學家和計算機科學家看到了DNA存儲無以復加的優(yōu)勢和廣闊的應用前景,但華盛頓大學的計算機安全研究專家卻注意到了其中潛在的風險。

將電腦病毒藏在DNA中

華盛頓大學計算機科學教授Tadayoshi Kohno等人注意到,基因檢測越來越常見。部分原因來自于DNA測序價格持續(xù)的下降,2000年左右,對一個人進行全基因組測序需要1億美金,到現(xiàn)在,這一價格已經(jīng)下降為約1000美金,研究人員們的未來目標是希望將這一價格降低到100美金。價格的下降、操作的便捷讓DNA測序應用范圍越來越廣泛,不僅僅是基礎生物學,還包括考古學、犯罪調(diào)查、產(chǎn)前診斷等等。在美國,個人基因檢測已經(jīng)成為一種潮流,為家中寵物進行基因檢測也越來越流行。

這就不得不考慮一種風險:DNA樣本來自外部來源,這可能難以適當?shù)貙彶?,那么其中是否會包含一個或幾個存儲惡意代碼的DNA片段?當這些DNA片段被測序并利用電腦軟件進行處理分析時,將對計算機安全造成怎樣的影響?

華盛頓大學的研究人員開始了他們的試驗。為了簡化整個試驗,首先,他們在一個用于DNA測序數(shù)據(jù)處理的開源軟件中人為的引入一個程序缺陷。實際上,研究人員分析了很多用于DNA數(shù)據(jù)處理與分析的開源生物信息學工具,他們發(fā)現(xiàn)很多工具都沒有遵循最佳的計算機安全保障方法,這給攻擊者留下了潛在的漏洞。

接著研究人員設計了一個惡意計算機代碼,希望利用“緩沖區(qū)溢出”攻擊計算機,緩沖區(qū)溢出是針對程序設計缺陷,向程序輸入緩沖區(qū)寫入使之溢出的內(nèi)容,從而破壞程序運行,趁程序中斷之際奪取程序乃至計算機系統(tǒng)的控制權。

不過將惡意計算機代碼轉(zhuǎn)化為DNA分子的過程并沒有研究人員原本想的那么簡單,當他們將精心設計的惡意代碼以A、T、G、C的形式輸入DNA分子合成網(wǎng)站時,出現(xiàn)了滿屏的錯誤。

用DNA藏匿電腦病毒:一次基因測序就劫取機密-肽度TIMEDOO

他們了解到,為了使DNA樣本保持穩(wěn)定,A、T、G、C必須保持合適的比例。研究人員不得不反復編寫惡意代碼,以找到合適的形式。按下訂購按鈕的一周后,一小瓶樣本就寄到了研究人員的手中。

通過測序,DNA樣本中的惡意程序被“釋放”了出來,攻擊軟件漏洞,入侵了電腦。“我們從理論上證明了,利用DNA存儲惡意代碼能夠攻擊計算機,但是我們現(xiàn)在并沒有證據(jù)表明DNA測序或者DNA數(shù)據(jù)的安全性目前正受到攻擊,我們希望在技術成熟之前,最好在新興技術的早期就考慮安全威脅?!必撠熢擁椖康娜A盛頓大學計算機科學教授Tadayoshi Kohno認為?!耙驗樵谡嬲墓舫霈F(xiàn)之前,安全問題更容易解決?!?/p>

研究人員認為,如果黑客真的采用這項攻擊方式,那么他們就可能獲得有價值的知識產(chǎn)權,或者可能污染與犯罪有關的基因分析結(jié)果。當然,企業(yè)也可能在轉(zhuǎn)基因產(chǎn)品中植入惡意代碼,以保護其商業(yè)機密?!拔磥磉@可能轉(zhuǎn)變成一些有趣,或者帶來威脅的應用?!毖芯咳藛T表示。

來源:環(huán)球科學