一個(gè)跨學(xué)科研究人員小組發(fā)現(xiàn)了一種新技術(shù),可以以前所未有的準(zhǔn)確性和效率在DNA信息中存儲(chǔ)這種情況,在本例中為“綠野仙蹤”,譯為世界語(yǔ)。該技術(shù)利用DNA交鏈的信息存儲(chǔ)能力,以持久且緊湊的方式編碼和檢索信息。
該技術(shù)在本周《美國(guó)科學(xué)院院刊》上的一篇論文中進(jìn)行了描述。
這項(xiàng)研究的作者之一,分子生物學(xué)副教授伊利亞·芬克爾斯坦(Ilya Finkelstein)表示:“關(guān)鍵的突破是一種編碼算法,即使在存儲(chǔ)過(guò)程中DNA鏈部分受損時(shí),也可以準(zhǔn)確地檢索信息。”
人類(lèi)正在以比過(guò)去高得多的速度創(chuàng)建信息,這促使人們需要一種有效地存儲(chǔ)更多信息并且持續(xù)時(shí)間長(zhǎng)的方式。諸如Google和Microsoft之類(lèi)的公司正在探索使用DNA存儲(chǔ)信息的公司。
與Finkelstein合作進(jìn)行這項(xiàng)研究的研究科學(xué)家斯蒂芬·瓊斯(Stephen Jones)說(shuō):“我們需要一種存儲(chǔ)這些數(shù)據(jù)的方法,以便可以隨時(shí)隨地以可讀的格式獲得這些數(shù)據(jù)。”Bill Press,計(jì)算機(jī)科學(xué)與整合生物學(xué)聯(lián)合任命的教授;和博士學(xué)位校友約翰·霍金斯(John Hawkins)。“這個(gè)想法利用了數(shù)十億年來(lái)生物學(xué)的優(yōu)勢(shì):將大量信息存儲(chǔ)在一個(gè)很小的空間中,可以持續(xù)很長(zhǎng)時(shí)間。DNA不會(huì)占用太多空間,可以在室溫下存儲(chǔ)它,可以持續(xù)數(shù)十萬(wàn)年。”
DNA的效率是當(dāng)前存儲(chǔ)方法的500萬(wàn)倍。換句話(huà)說(shuō),一滴DNA可以存儲(chǔ)與兩個(gè)裝有數(shù)據(jù)服務(wù)器的沃爾瑪相同數(shù)量的信息。而且,DNA不需要永久性的冷卻和容易發(fā)生機(jī)械故障的硬盤(pán)。
只有一個(gè)問(wèn)題:DNA容易出錯(cuò)。當(dāng)遺傳密碼有錯(cuò)誤時(shí),它與計(jì)算機(jī)密碼有錯(cuò)誤時(shí)有很大不同。計(jì)算機(jī)代碼中的錯(cuò)誤往往顯示為代碼中的空白點(diǎn)。DNA序列中的錯(cuò)誤顯示為插入或缺失。問(wèn)題在于,當(dāng)DNA中刪除或添加某些東西時(shí),整個(gè)序列會(huì)移動(dòng),而沒(méi)有空白點(diǎn)可以提醒任何人。
以前,當(dāng)信息存儲(chǔ)在DNA中時(shí),需要保存的信息片段(例如小說(shuō)中的一段)將重復(fù)10到15次。讀取信息后,將對(duì)重復(fù)進(jìn)行比較以消除任何插入或刪除。
瓊斯說(shuō):“我們找到了一種更像網(wǎng)格的方式來(lái)構(gòu)建信息的方法。”“每條信息都會(huì)增強(qiáng)其他信息。這樣一來(lái),它只需讀取一次即可。”
研究人員開(kāi)發(fā)的語(yǔ)言還避免了容易出錯(cuò)或難以閱讀的DNA部分。語(yǔ)言的參數(shù)也可以隨所存儲(chǔ)信息的類(lèi)型而變化。例如,在一本小說(shuō)中丟掉單詞并不像在納稅申報(bào)表中丟掉零一樣大。
為了演示如何從降解的DNA中檢索信息,研究小組將其“綠野仙蹤”代碼置于高溫和極端潮濕的環(huán)境中。即使這些惡劣條件損壞了DNA鏈,所有信息仍然可以成功解碼。
霍金斯說(shuō):“我們?cè)噲D同時(shí)解決該過(guò)程中的所有問(wèn)題,”霍金斯最近在UT的奧登大學(xué)計(jì)算工程與科學(xué)學(xué)院任職。“最終我們?nèi)〉昧朔欠驳某删汀?rdquo;