面向压缩生物基因数据的高效的查询方法
本文关键词:面向压缩生物基因数据的高效的查询方法
更多相关文章: 基因数据 大数据 可伸缩性 数据压缩 并行计算
【摘要】:随着下一代、第三代等测序技术的快速发展,DNA等生物序列数据快速增长.如何高效地处理这些大数据是目前所面临的一个挑战.研究发现,这些生物序列数据尽管很大,但是不同数据之间具有很高的相似性.因此可以通过保存这些基因串同一个基准序列之间的差异来减少存储的代价.最新的研究发现,可以在这些压缩的数据上直接进行查询,而不需要解压缩.研究的目标是进一步提高索引和查询的可伸缩性,从而满足日益增长的大数据需要.首先在现有方法的基础上,对基准序列进行了压缩存储.基于该压缩数据,提出了一系列优化查询方法以高效地支持任意长度序列的精确和近似查询.在此基础上,进一步对原有方法进行改进,利用并行计算来提高对大数据的查询效率.最后,实验研究展示了所提方法的高效性.
【作者单位】: 东北大学计算机科学与工程学院;
【关键词】: 基因数据 大数据 可伸缩性 数据压缩 并行计算
【基金】:国家自然科学基金优秀青年基金(61322208);国家自然科学基金(61272178,61572122,61532021) 国家重点基础研究发展计划(973)(2012CB316201)~~
【分类号】:TP311.13
【正文快照】:
【参考文献】
中国期刊全文数据库 前2条
1 林学民;王炜;;集合和字符串的相似度查询[J];计算机学报;2011年10期
2 朱扬勇;熊峗;;DNA序列数据挖掘技术[J];软件学报;2007年11期
【共引文献】
中国期刊全文数据库 前10条
1 张素莉;;基于部分连接神经网络的序列数据分类算法研究[J];现代电子技术;2016年09期
2 姜建华;杨玉免;边海燕;康嘉容;王丽敏;刘颖;;改进DBSCAN聚类算法在电子商务网站评价中的应用[J];吉林大学学报(理学版);2016年02期
3 王佳英;王斌;杨晓春;;面向压缩生物基因数据的高效的查询方法[J];软件学报;2016年07期
4 杨良斌;;数据挖掘领域研究现状与趋势的可视化分析[J];图书情报工作;2015年S2期
5 郭彦明;陈黎飞;郭躬德;;DNA序列的二阶隐马尔科夫模型分类[J];计算机系统应用;2015年09期
6 李圣文;凌微;龚君芳;周长征;;一种基于熵的文本相似性计算方法[J];计算机应用研究;2016年03期
7 丁学君;;微博舆情话题传播行为预测研究[J];中国管理信息化;2015年17期
8 梁路;王彪;王剑辉;刘冬宁;;基于细精度关联规则挖掘的电信客户流失分析[J];智能系统学报;2015年03期
9 陈一帆;赵翔;何培俊;张维明;唐九阳;;BMGSJoin:一种基于MapReduce的图相似度连接算法[J];模式识别与人工智能;2015年05期
10 肖雨;崔荣一;怀丽波;;一种融合位置信息的字符串相似度度量方法[J];计算机应用研究;2015年11期
【二级参考文献】
中国期刊全文数据库 前7条
1 王镝;赵毅;陈白尘;王国仁;;DNA序列中基于后继数组索引的SATR查找算法[J];东北大学学报(自然科学版);2007年02期
2 ;A measure of semantic similarity between gene ontology terms based on semantic pathway covering[J];Progress in Natural Science;2006年07期
3 王国仁;葛健;徐恒宇;郑若石;;基于二分频率变换的序列相似性查询处理技术[J];软件学报;2006年02期
4 王镝;王国仁;陈白尘;吴青泉;王斌;韩冬红;;一种可用于生物序列分析的轻量级索引结构[J];华中科技大学学报(自然科学版);2005年S1期
5 李冬冬;王正志;倪青山;;一种有效的重复序列识别算法[J];生物信息学;2005年04期
6 邓绪斌;朱扬勇;;ReDE:一个基于正则表达式的生物数据抽取方法[J];计算机研究与发展;2005年12期
7 ;Semantic Search among Heterogeneous Biological Databases Based on Gene Ontology[J];Acta Biochimica et Biophysica Sinica;2004年05期
【相似文献】
中国期刊全文数据库 前10条
1 安世虎;一种有效的报表查询方法[J];计算机应用研究;1995年02期
2 王侃夫;王慧;顾晓春;;基于总线结构的住户抄表查询方法和装置研究[J];上海电机学院学报;2007年04期
3 许景科;孙焕良;王永会;宋晓宇;;一种基于知识的多层概念化数据查询方法[J];小型微型计算机系统;2012年07期
4 庄丽娟,张玉民;Visual FoxPro6.0的复合查询方法设计[J];佳木斯大学学报(自然科学版);2003年02期
5 程飞;;基于云计算的图书数据库查询方法研究[J];计算机光盘软件与应用;2013年07期
6 周千明;王巧侠;朱欣娟;;通用动态多条件查询方法的研究与实现[J];电脑知识与技术;2011年04期
7 范军;网上查询方法浅谈[J];电脑爱好者;1998年13期
8 李久仲;石硕;沈轶;;基于集合分析的数据查询方法[J];华中科技大学学报(自然科学版);2008年12期
9 史新华;韦思惠;;期刊数据库索引与文章查询方法[J];广西物理;2012年01期
10 李占宣;;数据库中面向复杂应用的查询方法[J];电脑学习;2009年04期
中国重要会议论文全文数据库 前8条
1 王斌;李保栋;;电力营销决策支持系统中的查询方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 黄邦宇;吴效明;周静;;岛礁部队健康管理多字段数据库的多表查询方法[A];中国生物医学工程学会第六次会员代表大会暨学术会议论文摘要汇编[C];2004年
3 黄光安;肖璐;张亮;施伯乐;;一种基于文档编码的XML优化查询方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 廖顺和;乐嘉锦;;一种类K-means算法的高效近似查询方法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 翁伟;薛永生;段江娇;黄震华;;一种基于交叉链表的文档查询方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
6 李兴东;姜守旭;张硕;;一种处理图数据库中超图集合的查询方法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
7 何震瀛;李建中;高宏;;Web数据仓库的异步迭代查询方法(英文)[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
8 王敬贵;苏奋振;杨晓梅;杜云艳;仉天宇;;基于Ontology的空间知识查询方法研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
中国重要报纸全文数据库 前4条
1 ;防伪查询方法[N];中国质量报;2003年
2 ;部分省市高考分数查询方法[N];中国教育报;2006年
3 金爱玲;甘肃:管局工商联手治理[N];人民邮电;2005年
4 本报记者 秦延安 通讯员 孙少军;许可建设项目管理信息系统投入使用[N];中国水利报;2008年
中国硕士学位论文全文数据库 前10条
1 李雪城;大规模DAG图可达查询与优化方法研究[D];辽宁大学;2015年
2 吕倩楠;面向多维对象的反k近邻e笥行Р檠椒╗D];吉林大学;2012年
3 高世伟;三维空间中基于对象方位的方向关系查询方法研究[D];燕山大学;2010年
4 辛婷婷;K-匿名数据的查询方法研究[D];东华大学;2012年
5 彭川;反k最远邻查询方法的研究[D];燕山大学;2012年
6 任彩平;路网中连续路过近邻的查询方法[D];燕山大学;2010年
7 李艳群;网络教育资源的建设及查询方法研究[D];山东师范大学;2005年
8 李若愚;空间数据库中基于R-树的最近邻查询方法研究[D];哈尔滨工程大学;2010年
9 王璐;路网中互近邻查询和最大化双色反近邻查询方法研究[D];燕山大学;2010年
10 丁晓剑;对大信息量XML文档查询方法的研究[D];西安理工大学;2006年
,本文编号:971837
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/971837.html