正在閱讀:

存儲(chǔ)新圖譜:DNA存儲(chǔ)的邊界與天地

掃一掃下載界面新聞APP

存儲(chǔ)新圖譜:DNA存儲(chǔ)的邊界與天地

DNA存儲(chǔ)成為基礎(chǔ)的新存儲(chǔ)技術(shù)被作為優(yōu)先的研究方向。

文|腦極體

數(shù)字信息時(shí)代,無(wú)論是生產(chǎn)數(shù)據(jù)的各大視頻網(wǎng)站、應(yīng)用平臺(tái)等,還是消費(fèi)者們使用的各類電子設(shè)備,都無(wú)不在時(shí)時(shí)刻刻產(chǎn)生數(shù)據(jù)。

拿自動(dòng)駕駛舉例來(lái)說(shuō),平均每輛自動(dòng)駕駛車每天產(chǎn)生的數(shù)據(jù)量高達(dá)10TB。根據(jù)IDC機(jī)構(gòu)的預(yù)測(cè),2020年到2025年間,全球生成的數(shù)據(jù)(包括新數(shù)據(jù)和副本數(shù)據(jù))量預(yù)計(jì)復(fù)合年增長(zhǎng)率為23%,到2025年達(dá)到180ZB,每天幾乎產(chǎn)生490EB的數(shù)據(jù)。

數(shù)據(jù)也成為繼土地、勞動(dòng)力、資本、技術(shù)之后的第五種生產(chǎn)要素,所有基于數(shù)據(jù)的挖掘和增值都離不開(kāi)存儲(chǔ)。存儲(chǔ)成為數(shù)據(jù)應(yīng)用的基礎(chǔ),其存儲(chǔ)方式也隨著數(shù)據(jù)量的激增與需求不斷發(fā)生變化。在信息與技術(shù)的不斷發(fā)展演進(jìn)中,存儲(chǔ)開(kāi)始面臨不少的挑戰(zhàn)。

存儲(chǔ)設(shè)備、介質(zhì)(磁性材料和半導(dǎo)體材料)隨時(shí)間的老化與更新不及時(shí),存儲(chǔ)維護(hù)成本高,存儲(chǔ)密度的局限以及能源功耗大等。這些現(xiàn)實(shí)的困境驅(qū)動(dòng)業(yè)界開(kāi)始尋找更好的替代方案,滿足不斷增高的性能、低功耗、穩(wěn)定性等需求。

DNA存儲(chǔ)成為基礎(chǔ)的新存儲(chǔ)技術(shù)被作為優(yōu)先的研究方向,以解決數(shù)據(jù)存儲(chǔ)中存在的負(fù)荷與問(wèn)題。我們經(jīng)常會(huì)在新聞中看到,考古學(xué)家通過(guò)什么DNA測(cè)定,了解到幾百年、幾千年的信息。據(jù)悉,在合適的條件下,DNA可以持續(xù)存在數(shù)十萬(wàn)年,甚至幾百萬(wàn)年。

不考慮DNA的其他存儲(chǔ)特性,僅僅憑借著恒久的保存時(shí)間,我們的數(shù)據(jù)也有可能成為和“化石”一樣的存在,這個(gè)特性就十分值得我們長(zhǎng)久地下功夫去研究與投資。當(dāng)然,DNA存儲(chǔ)的優(yōu)勢(shì)不止如此。

存儲(chǔ)效率的千倍提升

簡(jiǎn)單來(lái)說(shuō),DNA存儲(chǔ)原理就是將DNA分子中的堿基序列與存儲(chǔ)信息編碼一一對(duì)應(yīng),將文字、圖片、聲音等信息轉(zhuǎn)化為DNA序列進(jìn)行存儲(chǔ)。這是一門需要多學(xué)科交叉的高精尖技術(shù),涉及生物、計(jì)算機(jī)、化學(xué)等學(xué)科。

在生物分子中儲(chǔ)存信息,非常復(fù)雜??茖W(xué)家們將目光與精力投入到DNA存儲(chǔ)的領(lǐng)域,最根本的原因是看重其極高的存儲(chǔ)密度特性。據(jù)悉,1克DNA即可儲(chǔ)存215PB的信息,而硬盤的存儲(chǔ)量不過(guò)幾TB。要知道,1PB=1024TB=1024X1024GB,按照高清電影每部10GB算,1克DNA能夠存儲(chǔ)2.2億部電影。與此同時(shí)DNA存儲(chǔ)的維護(hù)成本也相較數(shù)據(jù)中心低很多。在能耗方面,1GB的數(shù)據(jù)硬盤存儲(chǔ)能耗約為0.04W,而DNA存儲(chǔ)的能耗則遠(yuǎn)遠(yuǎn)小于硬盤存儲(chǔ)能耗,可忽略不計(jì)。

在數(shù)據(jù)量日漸激增的信息時(shí)代,高存儲(chǔ)密度,低成本維護(hù)與低能耗儲(chǔ)存信息的方式,使得科研機(jī)構(gòu)與資本都將精力與金錢押碼在這個(gè)可能成為未來(lái)主流存儲(chǔ)方式。不過(guò)雖然有資金與科研的投入,但其進(jìn)展仍較為緩慢。我們能在公開(kāi)渠道中看到的成果都是實(shí)驗(yàn)室的最佳成績(jī)。例如2012年,哈佛大學(xué)研究人員用DNA儲(chǔ)存了一本五萬(wàn)字的圖書。歐洲生物信息研究所在DNA儲(chǔ)存了莎士比亞的十四行詩(shī)以及馬丁·路德·金的演講《我有一個(gè)夢(mèng)想》的錄音帶。

從上世紀(jì)50年代提出,DNA的數(shù)據(jù)存儲(chǔ)研究的進(jìn)展一直緩慢,沒(méi)有什么較為重大的變化。不過(guò)在近兩年,DNA存儲(chǔ)的技術(shù)開(kāi)始有了一些新的進(jìn)展。近日微軟研究院對(duì)外宣稱,研究出新的分子控制器,使得DNA的存儲(chǔ)寫入的速度相較以往提高了1000倍。微軟研究院作為DNA數(shù)據(jù)存儲(chǔ)的早期入局者,2015年開(kāi)始進(jìn)行相關(guān)研究,直到2019年才有研發(fā)進(jìn)展,到如今速率千倍的升級(jí),還是著實(shí)下了一番功夫。

與此同時(shí),國(guó)內(nèi)的東南大學(xué)生物科學(xué)與醫(yī)學(xué)工程的劉宏團(tuán)隊(duì)也實(shí)現(xiàn)了DNA存儲(chǔ)的新突破:立足自主開(kāi)發(fā)實(shí)現(xiàn)了DNA合成與測(cè)序環(huán)節(jié)的一體化,儀器設(shè)備也實(shí)現(xiàn)了小型化。DNA存儲(chǔ)在國(guó)外的技術(shù)路線大都是存儲(chǔ)的合成與測(cè)序環(huán)節(jié)分開(kāi)進(jìn)行,需要大型的儀器設(shè)備,操作也相對(duì)復(fù)雜一些。劉宏團(tuán)隊(duì)將儀器設(shè)備等朝著便攜式改進(jìn)了許多。

佐治亞理工學(xué)院(GTRI)近期也公布了新進(jìn)展,他們的團(tuán)隊(duì)設(shè)計(jì)了一種微芯片,可以顯著提高以DNA形式寫入數(shù)據(jù)的速度。該團(tuán)隊(duì)預(yù)計(jì)將比當(dāng)前的DNA存儲(chǔ)技術(shù)提高100倍。

研究機(jī)構(gòu)的各種進(jìn)展也使得嗅覺(jué)靈敏的投資機(jī)構(gòu)風(fēng)聞而來(lái),中科碳元(深圳)、密碼子(杭州)等創(chuàng)業(yè)公司獲得數(shù)千萬(wàn)的天使輪融資。

而政策方面,DNA存儲(chǔ)已經(jīng)成為國(guó)家層面部署的重點(diǎn)發(fā)展方向。國(guó)家“十四五”規(guī)劃中提到要加快布局量子計(jì)算、量子通訊、神經(jīng)芯片、DNA存儲(chǔ)等前沿技術(shù)。我們可以看到,DNA存儲(chǔ)在政策、資本與技術(shù)的集中發(fā)力中開(kāi)始蓄勢(shì)待發(fā),不過(guò)對(duì)于這類高精尖的技術(shù)來(lái)說(shuō),距離其真正的商業(yè)化落地進(jìn)程還尚早。

難以突破的結(jié)構(gòu)性障礙

雖然DNA存儲(chǔ)具有較為明顯突出的優(yōu)勢(shì),政策、資本等也在全方位的支持,應(yīng)用的前景廣闊,但商業(yè)化的進(jìn)展仍然十分緩慢。其最大屏障來(lái)自于其存儲(chǔ)技術(shù)本身。

為了便于理解DNA存儲(chǔ)的面臨的技術(shù)困境,我們簡(jiǎn)單介紹一下DNA存儲(chǔ)數(shù)據(jù)的過(guò)程。主要分為以下五個(gè)步驟:編碼——將數(shù)字信息編碼為DNA序列;合成——將序列融入實(shí)際的DNA分子;存儲(chǔ)——將合成的DNA片段保存在載體或細(xì)胞中;訪問(wèn)——檢索和選擇性讀取序列信息;解碼——將測(cè)定的序列信息轉(zhuǎn)換回?cái)?shù)字信息。

在整個(gè)存儲(chǔ)的過(guò)程中,編碼與合成是DNA存儲(chǔ)中較為關(guān)鍵和困難的環(huán)節(jié)。尤其是DNA的合成過(guò)程最為艱辛,在堿基序列融入DNA分子的過(guò)程中,很容易隨機(jī)損失掉合成的DNA。

而編碼是DNA存儲(chǔ)中成本與難度較大的環(huán)節(jié),不過(guò)隨著AI、納米微孔等技術(shù)的發(fā)展,編碼環(huán)節(jié)的難度與成本都開(kāi)始逐漸降低。

DNA存儲(chǔ)的合成過(guò)程使得數(shù)據(jù)輸入和讀取的效率無(wú)法提上去,花費(fèi)的時(shí)間較長(zhǎng)、成本較高。據(jù)佐治亞理工學(xué)院2021年12月披露的信息稱,DNA存儲(chǔ)速度提升到了每天寫入20GB數(shù)據(jù),這是目前已知DNA存儲(chǔ)最快的寫入速度,而目前固態(tài)硬盤的讀寫速度最快大約為每秒500MB。

成本方面,2017年哥倫比亞大學(xué)的實(shí)驗(yàn)顯示,合成2MB的DNA數(shù)據(jù)需要7000美元,而讀取數(shù)據(jù)需要2000美元,如果用戶需要以DNA形式儲(chǔ)存1GB的電影,編碼大約需要花費(fèi)358萬(wàn)美元,而讀取數(shù)據(jù)還需要102萬(wàn)美元。DNA存儲(chǔ)技術(shù)的讀寫速度與成本,大大制約了其規(guī)模商業(yè)化的發(fā)展。

另外一個(gè)較大的影響因素跟科研人才相關(guān),由于DNA存儲(chǔ)技術(shù)領(lǐng)域的強(qiáng)學(xué)科交叉性,必須依靠計(jì)算機(jī)、生物、化學(xué)、數(shù)學(xué)等多個(gè)相關(guān)學(xué)科的協(xié)同,這也就對(duì)科研人才的復(fù)合能力水平要求較高。

當(dāng)然除了技術(shù)的進(jìn)階、人才的需求以外,存儲(chǔ)的便攜式要求也是其較為重要的發(fā)展方向需求。對(duì)于這類高精尖技術(shù)的設(shè)備,傳統(tǒng)的設(shè)備都較為笨重,便攜式的優(yōu)化也困難重重。總的來(lái)說(shuō),DNA存儲(chǔ)的各個(gè)環(huán)節(jié)都有較多的難關(guān)需要克服,DNA存儲(chǔ)真正意義上的走入商業(yè)市場(chǎng),進(jìn)一步發(fā)展成為主流的存儲(chǔ)設(shè)備,還需要長(zhǎng)時(shí)間的沉淀,才能讓DNA存儲(chǔ)技術(shù)有實(shí)質(zhì)的進(jìn)階。

終極存儲(chǔ):深空與亙古

對(duì)于數(shù)據(jù)的存儲(chǔ)來(lái)說(shuō),多元化、智能化、綠色化是其主要的發(fā)展風(fēng)向標(biāo),尤其是綠色的數(shù)據(jù)中心是主推的發(fā)展方向。

據(jù)研究機(jī)構(gòu)預(yù)測(cè),若能源利用效率得不到持續(xù)提高,數(shù)據(jù)存儲(chǔ)用電量到2030年可能增長(zhǎng)到全球用電總量的3%至13%。數(shù)據(jù)存儲(chǔ)的能源功耗令人擔(dān)憂,降低能耗將成為數(shù)據(jù)中心建設(shè)的首要目標(biāo),存儲(chǔ)設(shè)備作為數(shù)據(jù)中心中最為耗能的設(shè)備,成為革新的排頭兵。

目前改進(jìn)常見(jiàn)的思路是從存儲(chǔ)設(shè)備的硬件層面進(jìn)行考量,如架構(gòu)設(shè)計(jì)、芯片、硬盤介質(zhì)等。而DNA存儲(chǔ)可謂是存儲(chǔ)的終極進(jìn)化方向。據(jù)悉,麻省理工學(xué)院生物工程教授MarkBathe稱,理論上,一個(gè)裝滿DNA的咖啡杯就可以存儲(chǔ)世界上所有的數(shù)據(jù)。如果未來(lái)可以實(shí)現(xiàn),DNA存儲(chǔ)一定會(huì)革新存儲(chǔ)領(lǐng)域的格局。

在生物科技領(lǐng)域,近年來(lái)因?yàn)槿斯ぶ悄芗夹g(shù)的飛速發(fā)展,一些生物科技和人工智能交融的方面,例如蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)、新藥的研發(fā)、制備都有了質(zhì)的飛躍。DNA存儲(chǔ)在AI技術(shù)的加持下,其編碼的環(huán)節(jié)效率也獲得了極大地提升。未來(lái)隨著納米技術(shù)與AI技術(shù)的加持,DNA存儲(chǔ)的技術(shù)也會(huì)一步步解除智識(shí)的限制禁錮,逐步升級(jí),為存儲(chǔ)領(lǐng)域帶來(lái)質(zhì)的飛躍。

當(dāng)然DNA存儲(chǔ)除了數(shù)據(jù)的存儲(chǔ)外,也有一些新應(yīng)用方向的可能。比如,可以把個(gè)人健康歷史數(shù)據(jù)存儲(chǔ)進(jìn)DNA,這種存儲(chǔ)方法與人體更兼容,醫(yī)生可以隨時(shí)的調(diào)用參考這些病例數(shù)據(jù),更加精準(zhǔn)全面地進(jìn)行治療,改善病患的健康情況,甚至促進(jìn)壽命的增加。

未來(lái)人類深空宇航飛行的時(shí)候,可以用DNA存儲(chǔ)信息,只要制備適宜的保存條件,這些訊息就會(huì)留存,向宇宙深處傳播;也可能存在這種情形,新人類在考古的時(shí)候,發(fā)掘出我們存儲(chǔ)在DNA的彩蛋,DNA的數(shù)據(jù)展開(kāi)是一部先輩留存的文明與技術(shù)訊息,訴說(shuō)著我們的輝煌與經(jīng)驗(yàn),感覺(jué)有種終極的浪漫。我們最后要留下什么傳承,如何實(shí)現(xiàn)這個(gè)技術(shù),這個(gè)終極的存儲(chǔ)進(jìn)化值得我們?nèi)パ芯颗c等待。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

存儲(chǔ)新圖譜:DNA存儲(chǔ)的邊界與天地

DNA存儲(chǔ)成為基礎(chǔ)的新存儲(chǔ)技術(shù)被作為優(yōu)先的研究方向。

文|腦極體

數(shù)字信息時(shí)代,無(wú)論是生產(chǎn)數(shù)據(jù)的各大視頻網(wǎng)站、應(yīng)用平臺(tái)等,還是消費(fèi)者們使用的各類電子設(shè)備,都無(wú)不在時(shí)時(shí)刻刻產(chǎn)生數(shù)據(jù)。

拿自動(dòng)駕駛舉例來(lái)說(shuō),平均每輛自動(dòng)駕駛車每天產(chǎn)生的數(shù)據(jù)量高達(dá)10TB。根據(jù)IDC機(jī)構(gòu)的預(yù)測(cè),2020年到2025年間,全球生成的數(shù)據(jù)(包括新數(shù)據(jù)和副本數(shù)據(jù))量預(yù)計(jì)復(fù)合年增長(zhǎng)率為23%,到2025年達(dá)到180ZB,每天幾乎產(chǎn)生490EB的數(shù)據(jù)。

數(shù)據(jù)也成為繼土地、勞動(dòng)力、資本、技術(shù)之后的第五種生產(chǎn)要素,所有基于數(shù)據(jù)的挖掘和增值都離不開(kāi)存儲(chǔ)。存儲(chǔ)成為數(shù)據(jù)應(yīng)用的基礎(chǔ),其存儲(chǔ)方式也隨著數(shù)據(jù)量的激增與需求不斷發(fā)生變化。在信息與技術(shù)的不斷發(fā)展演進(jìn)中,存儲(chǔ)開(kāi)始面臨不少的挑戰(zhàn)。

存儲(chǔ)設(shè)備、介質(zhì)(磁性材料和半導(dǎo)體材料)隨時(shí)間的老化與更新不及時(shí),存儲(chǔ)維護(hù)成本高,存儲(chǔ)密度的局限以及能源功耗大等。這些現(xiàn)實(shí)的困境驅(qū)動(dòng)業(yè)界開(kāi)始尋找更好的替代方案,滿足不斷增高的性能、低功耗、穩(wěn)定性等需求。

DNA存儲(chǔ)成為基礎(chǔ)的新存儲(chǔ)技術(shù)被作為優(yōu)先的研究方向,以解決數(shù)據(jù)存儲(chǔ)中存在的負(fù)荷與問(wèn)題。我們經(jīng)常會(huì)在新聞中看到,考古學(xué)家通過(guò)什么DNA測(cè)定,了解到幾百年、幾千年的信息。據(jù)悉,在合適的條件下,DNA可以持續(xù)存在數(shù)十萬(wàn)年,甚至幾百萬(wàn)年。

不考慮DNA的其他存儲(chǔ)特性,僅僅憑借著恒久的保存時(shí)間,我們的數(shù)據(jù)也有可能成為和“化石”一樣的存在,這個(gè)特性就十分值得我們長(zhǎng)久地下功夫去研究與投資。當(dāng)然,DNA存儲(chǔ)的優(yōu)勢(shì)不止如此。

存儲(chǔ)效率的千倍提升

簡(jiǎn)單來(lái)說(shuō),DNA存儲(chǔ)原理就是將DNA分子中的堿基序列與存儲(chǔ)信息編碼一一對(duì)應(yīng),將文字、圖片、聲音等信息轉(zhuǎn)化為DNA序列進(jìn)行存儲(chǔ)。這是一門需要多學(xué)科交叉的高精尖技術(shù),涉及生物、計(jì)算機(jī)、化學(xué)等學(xué)科。

在生物分子中儲(chǔ)存信息,非常復(fù)雜??茖W(xué)家們將目光與精力投入到DNA存儲(chǔ)的領(lǐng)域,最根本的原因是看重其極高的存儲(chǔ)密度特性。據(jù)悉,1克DNA即可儲(chǔ)存215PB的信息,而硬盤的存儲(chǔ)量不過(guò)幾TB。要知道,1PB=1024TB=1024X1024GB,按照高清電影每部10GB算,1克DNA能夠存儲(chǔ)2.2億部電影。與此同時(shí)DNA存儲(chǔ)的維護(hù)成本也相較數(shù)據(jù)中心低很多。在能耗方面,1GB的數(shù)據(jù)硬盤存儲(chǔ)能耗約為0.04W,而DNA存儲(chǔ)的能耗則遠(yuǎn)遠(yuǎn)小于硬盤存儲(chǔ)能耗,可忽略不計(jì)。

在數(shù)據(jù)量日漸激增的信息時(shí)代,高存儲(chǔ)密度,低成本維護(hù)與低能耗儲(chǔ)存信息的方式,使得科研機(jī)構(gòu)與資本都將精力與金錢押碼在這個(gè)可能成為未來(lái)主流存儲(chǔ)方式。不過(guò)雖然有資金與科研的投入,但其進(jìn)展仍較為緩慢。我們能在公開(kāi)渠道中看到的成果都是實(shí)驗(yàn)室的最佳成績(jī)。例如2012年,哈佛大學(xué)研究人員用DNA儲(chǔ)存了一本五萬(wàn)字的圖書。歐洲生物信息研究所在DNA儲(chǔ)存了莎士比亞的十四行詩(shī)以及馬丁·路德·金的演講《我有一個(gè)夢(mèng)想》的錄音帶。

從上世紀(jì)50年代提出,DNA的數(shù)據(jù)存儲(chǔ)研究的進(jìn)展一直緩慢,沒(méi)有什么較為重大的變化。不過(guò)在近兩年,DNA存儲(chǔ)的技術(shù)開(kāi)始有了一些新的進(jìn)展。近日微軟研究院對(duì)外宣稱,研究出新的分子控制器,使得DNA的存儲(chǔ)寫入的速度相較以往提高了1000倍。微軟研究院作為DNA數(shù)據(jù)存儲(chǔ)的早期入局者,2015年開(kāi)始進(jìn)行相關(guān)研究,直到2019年才有研發(fā)進(jìn)展,到如今速率千倍的升級(jí),還是著實(shí)下了一番功夫。

與此同時(shí),國(guó)內(nèi)的東南大學(xué)生物科學(xué)與醫(yī)學(xué)工程的劉宏團(tuán)隊(duì)也實(shí)現(xiàn)了DNA存儲(chǔ)的新突破:立足自主開(kāi)發(fā)實(shí)現(xiàn)了DNA合成與測(cè)序環(huán)節(jié)的一體化,儀器設(shè)備也實(shí)現(xiàn)了小型化。DNA存儲(chǔ)在國(guó)外的技術(shù)路線大都是存儲(chǔ)的合成與測(cè)序環(huán)節(jié)分開(kāi)進(jìn)行,需要大型的儀器設(shè)備,操作也相對(duì)復(fù)雜一些。劉宏團(tuán)隊(duì)將儀器設(shè)備等朝著便攜式改進(jìn)了許多。

佐治亞理工學(xué)院(GTRI)近期也公布了新進(jìn)展,他們的團(tuán)隊(duì)設(shè)計(jì)了一種微芯片,可以顯著提高以DNA形式寫入數(shù)據(jù)的速度。該團(tuán)隊(duì)預(yù)計(jì)將比當(dāng)前的DNA存儲(chǔ)技術(shù)提高100倍。

研究機(jī)構(gòu)的各種進(jìn)展也使得嗅覺(jué)靈敏的投資機(jī)構(gòu)風(fēng)聞而來(lái),中科碳元(深圳)、密碼子(杭州)等創(chuàng)業(yè)公司獲得數(shù)千萬(wàn)的天使輪融資。

而政策方面,DNA存儲(chǔ)已經(jīng)成為國(guó)家層面部署的重點(diǎn)發(fā)展方向。國(guó)家“十四五”規(guī)劃中提到要加快布局量子計(jì)算、量子通訊、神經(jīng)芯片、DNA存儲(chǔ)等前沿技術(shù)。我們可以看到,DNA存儲(chǔ)在政策、資本與技術(shù)的集中發(fā)力中開(kāi)始蓄勢(shì)待發(fā),不過(guò)對(duì)于這類高精尖的技術(shù)來(lái)說(shuō),距離其真正的商業(yè)化落地進(jìn)程還尚早。

難以突破的結(jié)構(gòu)性障礙

雖然DNA存儲(chǔ)具有較為明顯突出的優(yōu)勢(shì),政策、資本等也在全方位的支持,應(yīng)用的前景廣闊,但商業(yè)化的進(jìn)展仍然十分緩慢。其最大屏障來(lái)自于其存儲(chǔ)技術(shù)本身。

為了便于理解DNA存儲(chǔ)的面臨的技術(shù)困境,我們簡(jiǎn)單介紹一下DNA存儲(chǔ)數(shù)據(jù)的過(guò)程。主要分為以下五個(gè)步驟:編碼——將數(shù)字信息編碼為DNA序列;合成——將序列融入實(shí)際的DNA分子;存儲(chǔ)——將合成的DNA片段保存在載體或細(xì)胞中;訪問(wèn)——檢索和選擇性讀取序列信息;解碼——將測(cè)定的序列信息轉(zhuǎn)換回?cái)?shù)字信息。

在整個(gè)存儲(chǔ)的過(guò)程中,編碼與合成是DNA存儲(chǔ)中較為關(guān)鍵和困難的環(huán)節(jié)。尤其是DNA的合成過(guò)程最為艱辛,在堿基序列融入DNA分子的過(guò)程中,很容易隨機(jī)損失掉合成的DNA。

而編碼是DNA存儲(chǔ)中成本與難度較大的環(huán)節(jié),不過(guò)隨著AI、納米微孔等技術(shù)的發(fā)展,編碼環(huán)節(jié)的難度與成本都開(kāi)始逐漸降低。

DNA存儲(chǔ)的合成過(guò)程使得數(shù)據(jù)輸入和讀取的效率無(wú)法提上去,花費(fèi)的時(shí)間較長(zhǎng)、成本較高。據(jù)佐治亞理工學(xué)院2021年12月披露的信息稱,DNA存儲(chǔ)速度提升到了每天寫入20GB數(shù)據(jù),這是目前已知DNA存儲(chǔ)最快的寫入速度,而目前固態(tài)硬盤的讀寫速度最快大約為每秒500MB。

成本方面,2017年哥倫比亞大學(xué)的實(shí)驗(yàn)顯示,合成2MB的DNA數(shù)據(jù)需要7000美元,而讀取數(shù)據(jù)需要2000美元,如果用戶需要以DNA形式儲(chǔ)存1GB的電影,編碼大約需要花費(fèi)358萬(wàn)美元,而讀取數(shù)據(jù)還需要102萬(wàn)美元。DNA存儲(chǔ)技術(shù)的讀寫速度與成本,大大制約了其規(guī)模商業(yè)化的發(fā)展。

另外一個(gè)較大的影響因素跟科研人才相關(guān),由于DNA存儲(chǔ)技術(shù)領(lǐng)域的強(qiáng)學(xué)科交叉性,必須依靠計(jì)算機(jī)、生物、化學(xué)、數(shù)學(xué)等多個(gè)相關(guān)學(xué)科的協(xié)同,這也就對(duì)科研人才的復(fù)合能力水平要求較高。

當(dāng)然除了技術(shù)的進(jìn)階、人才的需求以外,存儲(chǔ)的便攜式要求也是其較為重要的發(fā)展方向需求。對(duì)于這類高精尖技術(shù)的設(shè)備,傳統(tǒng)的設(shè)備都較為笨重,便攜式的優(yōu)化也困難重重。總的來(lái)說(shuō),DNA存儲(chǔ)的各個(gè)環(huán)節(jié)都有較多的難關(guān)需要克服,DNA存儲(chǔ)真正意義上的走入商業(yè)市場(chǎng),進(jìn)一步發(fā)展成為主流的存儲(chǔ)設(shè)備,還需要長(zhǎng)時(shí)間的沉淀,才能讓DNA存儲(chǔ)技術(shù)有實(shí)質(zhì)的進(jìn)階。

終極存儲(chǔ):深空與亙古

對(duì)于數(shù)據(jù)的存儲(chǔ)來(lái)說(shuō),多元化、智能化、綠色化是其主要的發(fā)展風(fēng)向標(biāo),尤其是綠色的數(shù)據(jù)中心是主推的發(fā)展方向。

據(jù)研究機(jī)構(gòu)預(yù)測(cè),若能源利用效率得不到持續(xù)提高,數(shù)據(jù)存儲(chǔ)用電量到2030年可能增長(zhǎng)到全球用電總量的3%至13%。數(shù)據(jù)存儲(chǔ)的能源功耗令人擔(dān)憂,降低能耗將成為數(shù)據(jù)中心建設(shè)的首要目標(biāo),存儲(chǔ)設(shè)備作為數(shù)據(jù)中心中最為耗能的設(shè)備,成為革新的排頭兵。

目前改進(jìn)常見(jiàn)的思路是從存儲(chǔ)設(shè)備的硬件層面進(jìn)行考量,如架構(gòu)設(shè)計(jì)、芯片、硬盤介質(zhì)等。而DNA存儲(chǔ)可謂是存儲(chǔ)的終極進(jìn)化方向。據(jù)悉,麻省理工學(xué)院生物工程教授MarkBathe稱,理論上,一個(gè)裝滿DNA的咖啡杯就可以存儲(chǔ)世界上所有的數(shù)據(jù)。如果未來(lái)可以實(shí)現(xiàn),DNA存儲(chǔ)一定會(huì)革新存儲(chǔ)領(lǐng)域的格局。

在生物科技領(lǐng)域,近年來(lái)因?yàn)槿斯ぶ悄芗夹g(shù)的飛速發(fā)展,一些生物科技和人工智能交融的方面,例如蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)、新藥的研發(fā)、制備都有了質(zhì)的飛躍。DNA存儲(chǔ)在AI技術(shù)的加持下,其編碼的環(huán)節(jié)效率也獲得了極大地提升。未來(lái)隨著納米技術(shù)與AI技術(shù)的加持,DNA存儲(chǔ)的技術(shù)也會(huì)一步步解除智識(shí)的限制禁錮,逐步升級(jí),為存儲(chǔ)領(lǐng)域帶來(lái)質(zhì)的飛躍。

當(dāng)然DNA存儲(chǔ)除了數(shù)據(jù)的存儲(chǔ)外,也有一些新應(yīng)用方向的可能。比如,可以把個(gè)人健康歷史數(shù)據(jù)存儲(chǔ)進(jìn)DNA,這種存儲(chǔ)方法與人體更兼容,醫(yī)生可以隨時(shí)的調(diào)用參考這些病例數(shù)據(jù),更加精準(zhǔn)全面地進(jìn)行治療,改善病患的健康情況,甚至促進(jìn)壽命的增加。

未來(lái)人類深空宇航飛行的時(shí)候,可以用DNA存儲(chǔ)信息,只要制備適宜的保存條件,這些訊息就會(huì)留存,向宇宙深處傳播;也可能存在這種情形,新人類在考古的時(shí)候,發(fā)掘出我們存儲(chǔ)在DNA的彩蛋,DNA的數(shù)據(jù)展開(kāi)是一部先輩留存的文明與技術(shù)訊息,訴說(shuō)著我們的輝煌與經(jīng)驗(yàn),感覺(jué)有種終極的浪漫。我們最后要留下什么傳承,如何實(shí)現(xiàn)這個(gè)技術(shù),這個(gè)終極的存儲(chǔ)進(jìn)化值得我們?nèi)パ芯颗c等待。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。