企业非结构化数据检索研究
本文关键词:企业非结构化数据检索研究
更多相关文章: Solr 非结构化数据 Hadoop 搜索引擎 全文检索
【摘要】:随着信息化的高速发展,企业内部各业务系统中非结构化数据的数据量急剧膨胀,使得信息的搜索工作变得极为繁琐。建设该企业级非结构化数据检索平台,在Linux计算机集群上部署Hadoop开发框架以及Solr全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务。介绍了Solr的原理,并使用它搭建非结构化数据的中文搜索引擎,通过测试证明了该搜索引擎具有良好的搜索性能。通过检索平台,用户能够快速而高效地获取精确的搜索结果。
【作者单位】: 昆明理工大学云南电网公司研究生工作站;云南电力试验研究院(集团)有限公司电力研究院;云南电力试验研究院(集团)
【分类号】:TP391.3
【正文快照】: 0引言非结构化数据约占企业数据总量的80%,除了数据总量大还具有格式多样、增长速度快等特点。非结构化数据包含有关企业发展的重要信息,其主要包括所有格式的办公文档、文本、XML/HTML、图片和音频/视频文件等。伴随信息化的建设和发展,企业每年非结构化数据的增长量已经达到
【参考文献】
中国期刊全文数据库 前6条
1 程志华;倪时龙;黄文思;龚贺;;企业级非结构化数据管理平台研究及实践[J];电力信息化;2012年03期
2 孙铁利;刘延吉;;中文分词技术的研究现状与困难[J];信息技术;2009年07期
3 崔杰;李陶深;兰红星;;基于Hadoop的海量数据存储平台设计与开发[J];计算机研究与发展;2012年S1期
4 李戴维;李宁;;基于Solr的分布式全文检索系统的研究与实现[J];计算机与现代化;2012年11期
5 邓鹏;李枚毅;何诚;;Namenode单点故障解决方案研究[J];计算机工程;2012年21期
6 林碧英;赵锐;陈良臣;;基于Lucene的全文检索引擎研究与应用[J];计算机技术与发展;2007年05期
【共引文献】
中国期刊全文数据库 前10条
1 董妍汝;;中文分词技术在搜索引擎中的应用[J];办公自动化;2010年04期
2 何友全;徐小乐;徐澄;栾红玉;唐华姣;;搜索引擎用户接口设计[J];重庆理工大学学报(自然科学版);2010年09期
3 蒋明原;孔令德;宁静静;;一种海量数据下的Lucene全文检索解决方案[J];电脑开发与应用;2011年04期
4 王成平;;彝文信息处理自动分词技术的研究现状与难点分析[J];电脑知识与技术;2012年04期
5 刘畅;张猛;;中文全文检索系统中基于分词技术的研究[J];吉林大学学报(信息科学版);2013年03期
6 鲁玉龙;李娟;张舒;徐瑞晨;程乐超;;DWT中文分词系统的设计与实现[J];计算机光盘软件与应用;2013年07期
7 李亮;;全台网环境下的云视频素材转码系统的设计[J];电视技术;2013年10期
8 钟锐;刘立刚;;基于Map-Reduce的FP-Growth算法研究[J];赣南师范学院学报;2013年06期
9 王延田;肖少辉;姜传鑫;;企业级非结构化数据中心存储组织形式探究[J];电力勘测设计;2014年01期
10 孙虞禄;万e,
本文编号:1177259
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1177259.html