当前位置:主页 > 科技论文 > 计算机论文 >

DNA存储及其研究进展

发布时间:2021-08-08 02:46
  DNA存储是一种以生物大分子DNA作为信息载体的一种新的存储技术。与传统的电子信息存储相比,DNA存储具有容量大、密度高、低能耗等优点。随着DNA合成、测序技术的发展以及大数据时代对数据存储需求的指数增长,近年来DNA存储在存储容量、密度以及可靠性等方面都取得了巨大的进展。该文主要介绍了DNA存储的发展历史、DNA存储的基本流程、DNA存储在数据库、文档存储以及体内存储的研究进展。最后,总结了DNA存储未来面临的挑战以及发展方向。 

【文章来源】:电子与信息学报. 2020,42(06)北大核心EICSCD

【文章页数】:6 页

【部分图文】:

DNA存储及其研究进展


DNA存储的主要流程

示意图,数据库,示意图,存储系统


图2 检索链和信息存贮链示意图DNA序列一般由数据区、索引编码区以及两端的扩增引物区组成。DNA存储的“写”(即合成)、“读”(即测序)过程往往容易产生核酸碱基的替换(substitutions)、插入(insertions)和删除(deletions)。此外,在数据的存储及检索过程的PCR扩增过程中,也可能产生扩增不平衡导致信息丢失现象。因此,编码技术对于DNA存储系统的稳定性、可靠性及效率至关重要。已有的各种存储研究都采用序列随机化、纠错码以及信息冗余等技术来降低“读”、“写”、“存”过程的错误影响。随着存储容量的增大,构建DNA存储系统所需的码字(codeword)也随之增大。Lenz等人[32]研究了DNA编码数量的上下限问题。Anavy等人[31]提出了DNA组合码的编码方法降低编码的冗余性。最近,Benner率领的研究团队[13]人工合成了另外4种核苷酸,突破性地创造出具有8个字母的DNA分子。碱基数的增加将进一步增加DNA编码的灵活性、鲁棒性以及编码空间。

冗余设计,数据链,策略,测序


首先,从大规模工业化应用的角度,目前的合成及测序成本还太高,特别是合成的费用大约是测序的4个数量级。从存储的角度长序列片段的存储效率更高,但是目前合成序列长度一般为100~300碱基,超过此长度的合成成本将急剧增加,同时合成和测序的错误率也会随之增加。因此,合成和测序技术的进步是DNA存储走向实际应用的技术基础。其次,从DNA存储信道模型的角度,编码理论及方法是DNA存储的核心理论问题,高效鲁棒的编码将有望克服目前DNA存储合成、PCR扩增及测序技术的不足,而且可能降低存储的费用。目前的编码基本的流程是将加入纠错冗余信息的二进制字符串直接翻译为DNA序列,这一编码方式将是基于二进制流的纠错,如何结合DNA生化特性,直接研究基于DNA信息流上的组合DNA编码理论将有望解决DNA存储信息到的高可信信息存储问题。

【参考文献】:
期刊论文
[1]音视频文件的DNA信息存储[J]. 陈为刚,黄刚,李炳志,尹烨,元英进.  中国科学:生命科学. 2020(01)
[2]DNA计算中的单模板编码方法改进研究[J]. 王向红,刘文斌,朱翔鸥,章林溪.  电子学报. 2009(12)
[3]一种优化DNA计算模板性能的新方法[J]. 刘文斌,朱翔鸥,王向红,张强,马润年.  电子与信息学报. 2008(05)
[4]DNA计算中的模板框优化方法研究[J]. 刘文斌,陈丽春,白宝钢,朱翔鸥,张强,马润年.  电子学报. 2007(08)



本文编号:3329057

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3329057.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2685f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com