麻省理工评论报道称,基于先前对 DNA 存储电影、文件的研究,微软正开发一种使用生物学替代磁带驱动器( tape drives)的设备。
微软研究院的计算机架构师表示,他们定下了个“小目标”:近十年内,建立在数据中心内基于 DNA 运转的运营存储系统。按照微软的构想,“三年内,原型商业化系统要能以 DNA 存储我们一个数据中心一定量的数据。”最终设备的模样,可能与20 世纪 70 年代 Xerox 复印机尺寸相当。
事实上,微软的目标远更雄心勃勃,微软研究院合伙架构师 Doug Carmean 表示,希望有朝一日,能直接标榜为“用 DNA 存储 ”(Your Storage with DNA)。这意味着,过去用以存档信息的常用方式——磁带驱动( tape drives)将落下帷幕。
让微软惦念着的,正是 DNA 存储技术。
DNA 是绝大部分生物体内有的遗传基因,学术上称为核糖核苷酸,由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)四对碱基对组成。别看仅有四对碱基,世界约 75 亿人模样等各异,起决定性作用的便是 DNA。这同时说明, DNA 其背后蕴藏着的整套遗传编码机制,能写入信息量之庞大。
知乎网友 talich 以莫尔斯电码能发的信息做类比,他称只要有时间空间,DNA 能写入的信息想要多少有多少。有研究人员表示,1 克 DNA 能容纳 455 EB(艾字节)数据,相当于 4550 亿 GB 字节的数据,而 5EB 就相当于至今全世界人类所讲过的话语,能存储的数据容量相当恐怖。
何况,DNA 存储数千年后,若保存完整,提取出来后依然能读取。因此你会看到,很多科学家孜孜不倦想从“古人”身上“挖”些什么,DNA 是揭密一切的关键。
反观市面在卖的台式机硬盘,6 TB 已是比较强大的存储容量,由于化学降解,数据能保存的时间 50 年基本是极限。且随着存储信息呈指数增长,用来存储的数据中心恐怕也得翻倍。
IDC 预计,今年全球范围内保存的数字化数据将达到 16 万亿 GB ,这些将存储在数据中心,未来,微软首席研究员卡林-施特劳斯指出,或许一个鞋盒大小的 DNA 存储介质,就能相当 100 个大型数据中心存储数据的能力。
正因 DNA 有高密度,每立方毫米能保存 1,000,000,000,000,000,000 字节的信息,及高效、存储量大、存储时间长、易获取且免维护等优点,才会有微软等科技公司都相聚该技术的前沿。
在微软看来,DNA 是长期存储数据的最佳介质。去年他们宣布赢得突破,还仅利用 DNA 存储技术完成约 100 部经典文学作品约 200MB 的数据保存工作,但这数字距离先前描绘的美好景象仍差距不小。
成本问题很实际,将数字位转化为 DNA 代码(A、G、C、T),制造 DNA 链的化学过程费时费力。麻省理工评论称,微软示范的项目中,使用了 13,448,372 个独特的DNA片段。专家说,在公开市场上购买这么多材料将花费 80 万美元。
要想广泛应用,微软表示至少得把成本降低 1 万倍,这在许多专家来看很难实现,不过微软相信,等计算机行业需求到了,自然就会发生。
目前将数据自动写入 DNA 的水平还有限,依据实验数据,速率大概仅有 400 字节/秒。因此,早期的存储技术更可能局限于特殊情况使用,包括需要根据法律或法规原因存档的数据,例如警察机构视频或医疗记录。未来,微软表示需要将写入水平提高至 100 M字节/秒。
此外,该技术中用的 DNA 是人工合成的,这方面,微软与 DNA 制造商 Twist Bioscience 达成合作,后者主要做提高 DNA 产量的活。
尽管,微软未给出详尽的产品细节计划,但至少看得出,DNA 存储作为来自未来的技术,给今后巨量的数据存储以想象空间,同时也为微软带来更多进展的可能