將全世界信息保存到百萬年后,存儲在哪里?
起源于幾千年前的中華“陰陽”思想,被應(yīng)用于今天的生物學(xué)技術(shù)領(lǐng)域,并可能逐步改變未來的大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。這或許是中國科學(xué)家才能碰撞出的“科技+文化”火花。
4月25日,《自然-計算科學(xué)》(Nature Computational Science)發(fā)表華大研究成果,研究團隊開創(chuàng)了一套獨具優(yōu)勢的“陰陽”編解碼系統(tǒng),用以解決當(dāng)前DNA信息存儲領(lǐng)域的技術(shù)難題。
所有信息在計算機中只由二進制的方式存儲,即0和1兩個數(shù)碼;
生物的遺傳信息則儲存在DNA中,以A、T、G、C四種堿基表現(xiàn)。
如果屏幕前的你是一位家長,在孩子學(xué)會這兩個知識點之后,或許可以引導(dǎo)他們思考:
倘若把信息語言的0和1,轉(zhuǎn)換為生物語言的ATGC,我們是不是就能把各類信息長久地保存在DNA中,讓DNA成為“完美”的存儲器了?
擅于把腦洞變?yōu)楝F(xiàn)實的科學(xué)家,已經(jīng)用實際研究成果對這個問題給出了樂觀的回答。
DNA憑什么碾壓現(xiàn)有信息存儲器?
我們正處在前所未有的信息大爆炸時代,據(jù)估算,2025年全球每天將產(chǎn)生491EB數(shù)據(jù)(1EB=1024PB,1PB=1024TB),相當(dāng)于每天制造出2億張DVD光盤。
隨著5G技術(shù)、大數(shù)據(jù)、人工智能等領(lǐng)域的蓬勃發(fā)展,海量數(shù)據(jù)如何長期穩(wěn)定存儲已成為亟待解決的一大難題,而以“BT+IT”融合的DNA信息存儲技術(shù),或能為這個問題提供更優(yōu)解,因此受到了越來越多的關(guān)注。
畢竟在存儲信息這件事上,DNA可以說是坐擁數(shù)十億年經(jīng)驗的資深前輩。相較于現(xiàn)有的U盤、硬盤、磁帶等介質(zhì),DNA具備無法比擬的優(yōu)勢:
其一,超高的信息密度:2012年《科學(xué)》雜志文章指出,1克DNA理論上可以存儲455EB數(shù)據(jù),相當(dāng)于數(shù)千萬個1TB移動硬盤的大小;
其二,超長的待機時間:DNA作為相對穩(wěn)定的分子,其半衰期長達521年,在理想狀態(tài)下甚至可保存成千上萬年;
其三,超強的生物兼容性:DNA作為絕大多數(shù)生物遺傳信息的載體,相對無機物、金屬等存儲介質(zhì)而言,具有更強的生物兼容性。
2019年,“DNA數(shù)據(jù)存儲器”入選《時代周刊》年度100項最佳發(fā)明。我們有理由相信,DNA憑借其獨家天然優(yōu)勢,在信息密度、復(fù)制與維護成本、使用壽命等方面都具有顛覆現(xiàn)有技術(shù)的巨大潛能。
研究10年,科學(xué)家們還有什么煩惱?
2012年開始,科學(xué)家們不斷進行DNA信息存儲的相關(guān)嘗試。由于必須考慮與當(dāng)下合成測序技術(shù)的兼容性以及成本問題,前期DNA所能存儲的信息密度都較低。于是,科學(xué)家們聚焦于如何提升存儲的信息密度,也關(guān)注于生物技術(shù)兼容性問題,但仍不全面。
一直到2017年,科學(xué)家引進信息通信領(lǐng)域的編碼方法——噴泉碼,以條件過濾的方式篩選DNA序列,唯有滿足篩選條件方可進行最終生成,基于此實現(xiàn)了對生物技術(shù)的兼容。
盡管DNA噴泉碼的誕生幾乎解決了此前的技術(shù)瓶頸,但實際應(yīng)用中也出現(xiàn)靈活性與適用性的問題。
一方面,噴泉碼技術(shù)的建立是基于通信技術(shù)領(lǐng)域的原理基礎(chǔ),對原始數(shù)據(jù)類型偏好較強(如需要01分布相對均勻等),因此面向生物與信息融合新興領(lǐng)域的DNA存儲技術(shù)應(yīng)用,存在一定的局限性。另一方面,通信領(lǐng)域的信號傳輸是即時的、可及時糾錯的,而生物領(lǐng)域的DNA分子存儲是異步異時的,一旦發(fā)生部分信息丟失或錯誤,便存在原有信息無法恢復(fù)的風(fēng)險。
如何在保證信息轉(zhuǎn)換效率和技術(shù)兼容的同時,大幅提高信息恢復(fù)的穩(wěn)定性?毋庸置疑,技術(shù)需要進一步發(fā)展。
以中華“陰陽”思想,解DNA存儲難題
面對DNA存儲中編解碼系統(tǒng)存在的棘手問題,深圳華大生命科學(xué)研究院(以下簡稱“華大研究院”)提供了全新的解決思路。中國科學(xué)家讓人驚喜的地方,在于能夠把我們引以為豪的古代哲學(xué)思想,融會貫通應(yīng)用到現(xiàn)代生物學(xué)之中,并期待以之解決未來世界的難題。
4月25日,華大研究院、深圳國家基因庫等多家機構(gòu)的研究團隊聯(lián)合在《自然》(Nature)子刊《自然-計算科學(xué)》發(fā)表研究論文。研究團隊結(jié)合DNA雙鏈模型,從中華文化中“陰陽”對立統(tǒng)一的思想獲得靈感,開創(chuàng)了一套名為“陰陽”的比特-堿基編解碼系統(tǒng),驗證了該系統(tǒng)在信息密度、技術(shù)兼容性、數(shù)據(jù)恢復(fù)穩(wěn)定性等多方面的優(yōu)勢。
陰陽哲理博大精深,其特點可簡單概括為統(tǒng)一、對立和互化。研究院團隊將其巧妙應(yīng)用到DNA編解碼系統(tǒng)當(dāng)中,以兩套不同的規(guī)則,分別對兩條二進制信息進行“一對一”編譯轉(zhuǎn)換,再取兩者統(tǒng)一交集的部分為最終解,實現(xiàn)將兩條獨立的信息組合統(tǒng)一為一串DNA序列。
機智的朋友可能會問,人工合成的DNA要保存在哪?目前,常用的保存方法分為體內(nèi)和體外兩種模式,兩者孰優(yōu)孰劣尚未形成明確定論。為了全方位驗證“陰陽”系統(tǒng)的信息恢復(fù)穩(wěn)定性,華大研究院團隊通過體外DNA干粉和細胞體內(nèi)大片段兩種存儲環(huán)境進行測試,皆實現(xiàn)了原始存儲數(shù)據(jù)的完整恢復(fù)。
體外模式,研究團隊采用不同濃度的原始DNA文庫溶液進行了共200多組測試。結(jié)果證明,“陰陽”編碼采用的線性數(shù)據(jù)恢復(fù)模式在每種DNA分子的平均拷貝數(shù)僅有100時,仍然能恢復(fù)最高88%的原始數(shù)據(jù)。而DNA噴泉碼使用的編碼方式使得每個數(shù)據(jù)包間存在一定的拓撲關(guān)聯(lián),在同樣條件下,平均恢復(fù)率僅有1.3%。
另一方面,研究將信息存在了酵母活細胞的體內(nèi),酵母菌株經(jīng)過1000代以上傳代之后,信息仍可以被完美恢復(fù)。這在一定程度上意味著,利用活體細胞作為DNA存儲的載體,上千年后原始信息或仍能被解讀。這樣的存儲方式可以得到接近于天然DNA分子存儲理論極限的物理信息密度,每克DNA能存儲的信息量約為432.2 EB。
華大研究團隊曾將《開國大典》影片存儲于DNA中
從起步至今短短十年時間,DNA信息存儲領(lǐng)域已取得不少令人矚目的研究成果,包括檢索、修改等高級功能也已完成原理驗證性的測試,以微軟、谷歌等產(chǎn)業(yè)巨頭形成的DNA存儲聯(lián)盟更是在為其商業(yè)化廣泛合作蓄勢。
在探索DNA信息存儲的同時,華大也在DNA合成、DNA測序的設(shè)備與技術(shù)自主研發(fā)道路上持續(xù)深耕?;谌A大的MPS合成技術(shù)和DNBSEQ測序技術(shù),結(jié)合本研究的比特-堿基編解碼技術(shù),華大已經(jīng)實現(xiàn)了DNA存儲的全流程技術(shù)閉環(huán)。相信隨著華大等全球科研機構(gòu)、數(shù)字信息產(chǎn)業(yè)界的不斷突破,在不遠的未來,“DNA硬盤”將成為我們?nèi)粘I钪斜夭豢缮俚臄?shù)據(jù)存儲設(shè)備之一。
該研究由深圳華大生命科學(xué)研究院主導(dǎo),深圳國家基因庫、首都師范大學(xué)、美國哈佛大學(xué)等多個研究團隊共同參與。華大研究院平質(zhì)博士為論文第一作者,華大研究院沈玥研究員、徐訊研究員與哈佛大學(xué)George M. Church教授為論文的共同通訊作者。
該研究受到國家重點研發(fā)計劃、國家青年科學(xué)基金、廣東省高通量基因組測序與合成編輯應(yīng)用重點實驗室、深圳合成生物學(xué)創(chuàng)新研究院等項目支持。本研究已通過倫理審查,嚴格遵循相應(yīng)法規(guī)和倫理準則。
(文中圖片由華大研究院提供)
您可能也感興趣:
今日熱點
為您推薦
一季度社?;鹦逻M14只個股 養(yǎng)老金賬戶新進9只個股
一季度廣東保險業(yè)總資產(chǎn)增長9.99% 面向服務(wù)業(yè)加大風(fēng)險保障力度
丹東發(fā)布工傷保險費率調(diào)整方案 將惠及1萬多戶參保單位
更多
- 鎧俠擴展面向高端客戶端應(yīng)用的PCIe?4.0固態(tài)硬盤產(chǎn)品陣容
- LED顯示屏頭部品牌視爵光旭一舉進攻國內(nèi)“視界” 爭奪萬億巨...
- 儒卓力實施大中國區(qū)拓展戰(zhàn)略 擴大中國臺灣辦事處
- 通用今年將向自動駕駛子公司Cruise提供20億美元
- 大國工匠創(chuàng)新交流大會舉行 設(shè)置全國職工創(chuàng)新成果等五個展區(qū)
- SK海力士發(fā)布2022財年第一季度財務(wù)報告
- "大連華信計算機技術(shù)股份有限公司"更名為"信華信技術(shù)股份有限...
- PIXELOGIC作為認證服務(wù)伙伴加入Pixelworks TrueCut Motion生態(tài)系統(tǒng)
排行
最近更新
- 將全世界信息保存到百萬年后,存儲在哪里?
- 無人值守也放心!中老鐵路有了智能化變配電設(shè)施
- 世界首臺樁梁一體智能造橋機“共工號”投入使用
- 中國城市知識產(chǎn)權(quán)指數(shù)報告2022在京發(fā)布
- 攜手共謀縣域創(chuàng)新 四川首次舉辦局縣科技會商
- 北京新落成一座航天科普館 航天迷們有了新的打卡勝地
- 新疆首個煤炭無人智能化驗室建成
- ?訪客數(shù)破千萬,第131屆廣交會線上平臺運行平穩(wěn)順暢
- 深圳地鐵13號線留百區(qū)間(留風(fēng)段)雙線順利貫通
- 抖音推出“星河知識計劃”
- 中國華能集中開工逾150個新能源項目
- 大連二季度766個重大項目集中簽約 進一步延伸產(chǎn)業(yè)鏈條
- 重慶體育人 | 因材施教 巴南體育老師宋軍專注培養(yǎng)學(xué)生運動興趣
- 鎧俠擴展面向高端客戶端應(yīng)用的PCIe?4.0固態(tài)硬盤產(chǎn)品陣容
- 護佑平安 全民反詐 | 因輕信“低價提前還車貸”,男子款未...
- 逾期未認證能領(lǐng)到養(yǎng)老金嗎
- LED顯示屏頭部品牌視爵光旭一舉進攻國內(nèi)“視界” 爭奪萬億巨...
- 肥鄉(xiāng)聯(lián)社為春耕備耕物資儲備企業(yè) 迅速紓困 助力企業(yè)復(fù)工復(fù)產(chǎn)
- 通用今年將向自動駕駛子公司Cruise提供20億美元
- 陳根:物聯(lián)網(wǎng)大步向前,安全問題也不可忽視
- 工行唐山分行以綠色金融“貸”動綠色發(fā)展
- 三個關(guān)鍵點,教會你怎么給孩子選黃金首飾
- 儒卓力實施大中國區(qū)拓展戰(zhàn)略 擴大中國臺灣辦事處
- 德清縣政協(xié)組織參加“浙江數(shù)字政協(xié)”建設(shè)工作推進會議
- 冀州農(nóng)商銀行“三舉措” 筑牢疫情防控和金融服務(wù)保障線
- 人民城市示范區(qū) | 沙坪壩:“群眾家門口的風(fēng)景”可望可及
- “十四五”文博事業(yè)如何布局?河南要打造中華文明標識體系
- 灤州農(nóng)商銀行疫情期間累計代發(fā)各類款項六千余萬元
- 重慶市籃管中心“全民健身月籃球云課堂”第四期:籃球的體能訓(xùn)練
- “小炒貨”撬動“大產(chǎn)業(yè)”——灤州農(nóng)商銀行三招精準助力特色...
今日要聞
- 無人值守也放心!中老鐵路有了智能化變配電設(shè)施
- 抖音推出“星河知識計劃”
- 五一民眾出游意愿達86.33% 3小時自駕出行圈誕生“新鮮玩法”
- ?訪客數(shù)破千萬,第131屆廣交會線上平臺運行平穩(wěn)順暢
- 精彩回顧|純堿跌價釋放壓力!鐵礦盤面高估值能否持續(xù)回落?
- 攜手共謀縣域創(chuàng)新 四川首次舉辦局縣科技會商
- 中國華能集中開工逾150個新能源項目
- 鎧俠擴展面向高端客戶端應(yīng)用的PCIe?4.0固態(tài)硬盤產(chǎn)品陣容
- 欣靈電氣過會:21家前員工為經(jīng)銷商,曾為8家經(jīng)銷商實控人發(fā)工資 上市委要求說明與上述經(jīng)銷商開展業(yè)務(wù)合理性是否有利益安排
- 新疆首個煤炭無人智能化驗室建成