logo 首頁 > 文匯報 > 教育 > 正文

【科學講堂】研DNA儲存海量數據

2017-07-05

借鑑大自然 唯「製作」需時 出錯率高

我們經常說現在是「大數據」的時代,因為我們每天的活動都在不停地製造新的數據:在YouTube收看及上載短片、在各社交平台分享的高清照片、到網上購物平台搜購心愛的物品,或是每天使用八達通卡四處遨遊的記錄。

2014年總數據佔百億張藍光碟

《自然材料科學》雜誌(Nature Materials)去年3月刊載的一篇文章*指出,2014年全世界共累積儲存了10億TB(terabyte)的數據,大約等於100億張藍光光碟的容量(一張3層BDXL格式藍光光碟的容量大約為100GB)。倘若依照過去增長的趨勢去預測,到了2040年,全球累積的數據數量將會再增多100倍。大家可有想過,如何能夠儲藏如此大量的資訊?

除了使用光學原理運作的各種光碟外,現今我們很多數據都是儲存於電腦硬盤(hard disc drive)和各種快閃記憶體(flash memory)中。硬盤主要是運用磁力來記下數據,令硬盤上的不同位置產生磁性就代表了不同的數據;快閃記憶體則利用了半導體(semiconductor)物料的特性,因此矽(silicon)這種半導體就成為了近年來需求殷切的材料。

上一段提過的文章甚至指出,到了2040年,矽的全球累積產量並不能用來製造足夠的快閃記憶體去儲藏如此大量的數據。再者,要收藏好這麼多的光碟、記憶體或硬盤,也很是令人頭痛。

(*編者註:標題為「Nucleic acid memory」,第一作者為Victor Zhirnov。)

《自然》文章:存全世界數據 僅需一公斤DNA

世界各地的一些科研人士(包括之前提過的Victor Zhirnov、英國的Nick Goldman、哈佛大學的George Church)卻有一個很有趣的靈感:大自然是如何儲存數據的?操控各種生命如何成長的遺傳密碼,不就是有效率地以DNA儲存於每個細胞核中?

人體的基因圖譜,可以看成是30億個串連在一起的「英文字母」,這樣大量的資訊,現正收藏於我們每顆連肉眼也看不見的細胞之中。

去年8月《自然》雜誌的另一篇報道也提到,倘若利用大腸桿菌基因儲存數據的密度來估算,要儲存全世界的數據,只需一公斤的DNA就足夠了。

那麼這個主意是否可行?其實科研人員早已掌握了按照自己心意製作DNA的技術,不過成本太高、需時太久了-製造一個DNA「英文字母」 需時大約400秒,而且出錯率還未到令人放心的地步。我們還需要繼續想想一些減低錯誤或自行修正錯誤的方法。

小 結

正如船隻流線型的設計取材於魚類身體的形狀,照相機的設計跟眼睛有幾分相像,看來人類又再一次在向自然學習。

當然用DNA儲存數據的意念還在起步階段,還有許多問題需要解決。不過,我們不時聽到,數十萬年前古生物的DNA還能被現在的我們檢測到。試想想:用DNA來做我們電腦的記憶裝置,那會是多麼的耐用啊! ■張文彥博士

作者簡介:香港大學土木及結構工程學士。短暫任職見習土木工程師後,決定追隨對科學的興趣,在加拿大多倫多大學取得理學士及哲學博士學位,修讀理論粒子物理。現於香港大學理學院任職講師,教授基礎科學及通識課程,不時參與科學普及與知識交流活動。

逢星期三見報

讀文匯報PDF版面

新聞排行
圖集
視頻