技术创新平台—企业级搜索引擎搭建
本文关键词:技术创新平台—企业级搜索引擎搭建
更多相关文章: Solr Nutch 中文分词 网页爬虫 搜索引擎
【摘要】:论述如何运用Nutch作为爬虫爬取数据、Solr作为搜索引擎服务器实现索引、使用IKAnalyzer完成中文分词来搭建一个企业级搜索引擎。并对定制技术创新平台的搜索引擎需要解决的问题进行分析和提供解决方案。
【作者单位】: 云南电网有限责任公司电力科学研究院;昆明能讯科技有限责任公司;
【关键词】: Solr Nutch 中文分词 网页爬虫 搜索引擎
【分类号】:TP391.3
【正文快照】: 0前言各种搜索引擎的功能侧重不一样,依靠单一的搜索引擎不能完全提供需要的信息,因此需要一种软件或网站把各种搜索引擎无缝地融合在一起,智能搜索引擎是结合了人工智能技术的新一代搜索引擎。除了能提供传统的快速检索、相关度排序等功能,还能提供用户角色登记、用户兴趣自
【参考文献】
中国期刊全文数据库 前2条
1 王小正;侯青;;基于Nutch和Solr的基础教育垂直搜索引擎的实现[J];电脑知识与技术;2012年04期
2 赵凯;王敏;;基于Solr的企业级搜索引擎的设计[J];电子世界;2013年22期
【共引文献】
中国期刊全文数据库 前1条
1 赵永鑫;张友华;辜丽川;胡嘉伟;陈莹;;基于Nutch的农村信息服务移动垂直搜索引擎研究[J];洛阳理工学院学报(自然科学版);2015年03期
【二级参考文献】
中国期刊全文数据库 前8条
1 杨晓江;李丽娟;田俊华;李艺;;面向基础教育的Web资源垂直服务体系研究[J];中国远程教育;2006年07期
2 丁伟;谢彦峰;张忠林;;一种基于用户兴趣的搜索引擎输入信息处理方法[J];电脑与信息技术;2008年05期
3 张斌;周尔宁;;基于Nutch的分布式纺织垂直搜索引擎研究[J];电脑知识与技术;2009年21期
4 张敏;;中文垂直搜索引擎研究与实现[J];福建电脑;2010年06期
5 潘涛;梁正友;;Nutch中网页排序效果的改进方法[J];计算机工程;2010年13期
6 申晋;;基于Lucene和Nutch的林业垂直搜索引擎的研建[J];农业网络信息;2008年04期
7 李明涛;罗军勇;尹美娟;路林;;结合词义的文本特征词权重计算方法[J];计算机应用;2012年05期
8 王超;李书琴;肖红;;基于本体的旱区农业垂直搜索引擎研究[J];农机化研究;2013年08期
【相似文献】
中国期刊全文数据库 前10条
1 程传鹏;;一种简单高效的中文分词方法[J];郑州轻工业学院学报;2006年03期
2 张博;姜建国;万平国;;对互联网环境下中文分词系统的一种架构改进[J];计算机应用研究;2006年11期
3 夏新松;肖建国;;一种新的错误驱动学习方法在中文分词中的应用[J];计算机科学;2006年03期
4 周军;王艳红;;一种基于词典的中文分词法的设计与实现[J];黑龙江科技信息;2008年25期
5 许高建;胡学钢;路遥;王庆人;;一种改进的中文分词歧义消除算法研究[J];合肥工业大学学报(自然科学版);2008年10期
6 张培颖;;运用有向图进行中文分词研究[J];计算机工程与应用;2009年22期
7 吴晶晶;荆继武;聂晓峰;王平建;;一种快速中文分词词典机制[J];中国科学院研究生院学报;2009年05期
8 许华;;中文分词系统设计之词典构造[J];科技创新导报;2010年20期
9 韩月阳;邓世昆;贾时银;李远方;;基于字分类的中文分词的研究[J];计算机技术与发展;2011年07期
10 莫建文;郑阳;首照宇;张顺岚;;改进的基于词典的中文分词方法[J];计算机工程与设计;2013年05期
中国重要会议论文全文数据库 前10条
1 王敏;叶宽余;薛峰;;一种面向网店商品搜索的中文分词系统设计[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
2 黄昌宁;赵海;;由字构词——中文分词新方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 黄居仁;;瓶颈,挑战,与转机:中文分词研究的新思维[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 任飞亮;石磊;姚天顺;;应用支持向量机进行中文分词[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 吴晶晶;荆继武;王平建;;一种基于词典的新型中文分词机制[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
6 李玉梅;靳光瑾;黄昌宁;;中文分词规范中的歧义字段消解细则[A];第五届全国语言文字应用学术研讨会论文集[C];2007年
7 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 赵海;揭春雨;;基于子串标注的中文分词:寻找更佳的标注单元[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 李寿山;黄居仁;;基于词边界分类的中文分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 张梅山;邓知龙;车万翔;刘挺;;统计与词典相结合的领域自适应中文分词[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国重要报纸全文数据库 前4条
1 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
2 清华大学IT可用性实验室;2005中文搜索引擎质量对比[N];计算机世界;2005年
3 蔡勇邋北京师范大学珠海分校软件研究所所长助理;让中药查询省时省力[N];科技日报;2007年
4 记者 杨朝晖;医药搜索:不再“众里寻他千百度”[N];科技日报;2007年
中国博士学位论文全文数据库 前3条
1 修驰;适应于不同领域的中文分词方法研究与实现[D];北京工业大学;2013年
2 何嘉;基于遗传算法优化的中文分词研究[D];电子科技大学;2012年
3 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
中国硕士学位论文全文数据库 前10条
1 曹卫峰;中文分词关键技术研究[D];南京理工大学;2009年
2 许顺;中文分词规范可计算化的研究与实现[D];苏州大学;2006年
3 王荔;统计全切分中文分词系统的研究与实现[D];西安电子科技大学;2009年
4 魏博诚;中文分词交集型歧义处理研究[D];安徽大学;2011年
5 代聪;基于英汉平行语料的中文分词研究与应用[D];大连理工大学;2012年
6 黄翼彪;开源中文分词器的比较研究[D];郑州大学;2013年
7 许华婷;基于Active Learning的中文分词领域自适应方法的研究[D];北京交通大学;2015年
8 王为磊;基于多目标优化的中文分词模型的研究[D];苏州大学;2008年
9 王靖;基于机械切分和标注的中文分词研究[D];湖南大学;2009年
10 刘春辉;基于优化最大匹配的中文分词方法研究[D];燕山大学;2009年
,本文编号:989049
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/989049.html