“材料基因”高性能化学信息检索系统的设计与实现
发布时间:2018-04-21 09:10
本文选题:材料信息学 + 搜索引擎 ; 参考:《中国科学技术大学》2017年硕士论文
【摘要】:化学信息学和材料信息学在今天的化学研究中地位日益显著,而在其中,计算机辅助的化学信息检索,包括基于关键字的检索、基于数值的过滤,以及结构检索,成为了实现高效化学信息管理的重要部分。为此,笔者在CouchDB和ElasticSearch基础之上,开发了一个名为DCAIKU的高效率、高灵活性的化学结构和数据检索系统。DCAIKU可以高效处理对于化学关键字、数值的过滤,并且通过描述符机制,将化学结构检索转换为和文本检索相似的模式。除此之外,DCAIKU通过选择使用无模式的文档数据库,使其可以支持多样性巨大的化学信息。通过在百万量级的数据库中和其他同类服务对比测试,笔者认为DCAIKU对于关键字和结构的检索性能都处于优势地位:准确性达到与同类检索工具相当的水准,可以轻松应对百万量级的记录,维持检索过程的吞吐量和低延迟,且响应速度和吞吐量均提高了一个数量级。故此笔者认为DCAIKU可以成为下一代大规模、低成本的材料检索体系的基础。
[Abstract]:Chemical informatics and material informatics play an increasingly important role in today's chemical research, in which computer-aided chemical information retrieval, including keyword-based retrieval, numerical filtering, and structural retrieval, It has become an important part of realizing the efficient management of chemical information. Therefore, on the basis of CouchDB and ElasticSearch, a highly efficient and flexible chemical structure and data retrieval system called DCAIKU is developed. Chemical structure retrieval is converted to a pattern similar to text retrieval. In addition, DCAIKU can support a wide variety of chemical information by opting to use schema-free document databases. By comparing and testing with other similar services in a million-scale database, the author thinks that DCAIKU is in a superior position in terms of keyword and structure retrieval performance: accuracy is comparable to that of similar retrieval tools. It can easily deal with millions of order of magnitude records, maintain the throughput and low latency of the retrieval process, and increase the response speed and throughput by one order of magnitude. Therefore, I believe that DCAIKU can become the basis of the next generation of large-scale and low-cost material retrieval system.
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O6-39
【相似文献】
中国期刊全文数据库 前10条
1 罗代洪,颜茂弘;分析方法标准信息检索系统[J];化学通报;1994年07期
2 王新政;夏媛媛;;专利信息检索系统设计[J];广西轻工业;2009年09期
3 杨斌;纺织品模糊信息检索系统[J];纺织学报;1994年09期
4 吴延凤,周全明;超文本中英文信息检索系统的实现[J];江苏煤炭;2001年03期
5 黄俊,周申范;环境监测方法信息检索系统的开发[J];环境监测管理与技术;1999年03期
6 刘永强;图书馆网上信息检索系统的设计与实现[J];连云港化工高等专科学校学报;2001年01期
7 阳世青;有色金属科技信息检索系统研究[J];世界有色金属;1997年09期
8 孔田野;李万龙;张海鸥;;基于药品本体的信息检索系统研究[J];河北科技大学学报;2008年03期
9 杨铭,,宋宇红,葛春光,王志丹;微机信息检索系统的设计与实现[J];齐齐哈尔轻工学院学报;1995年03期
10 夏玉杰;张栓记;;基于ARM的嵌入式信息检索系统设计和实现[J];化工自动化及仪表;2010年01期
中国重要会议论文全文数据库 前5条
1 倪耀群;许洪波;谭婧霞;唐慧丰;程学旗;孟丹;;基于优化维汉双语词典的多语言信息检索系统[A];第六届全国信息检索学术会议论文集[C];2010年
2 林耀q
本文编号:1781796
本文链接:https://www.wllwen.com/kejilunwen/huaxue/1781796.html
教材专著