当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于NLP技术和相似度计算的智能搜索引擎研究

发布时间:2018-11-19 09:52
【摘要】:针对传统的搜索引擎对于自然语言理解方面存在的问题,文章研究了一种新的基于自然语言处理技术和相似度计算的智能搜索引擎的模型.其核心技术是基于自然语言处理的中文分词技术、语义相似度和对立度等理论,将这些概念理论结合起来,从用户习惯的思考角度,结合DotLucene开源全文搜索引擎建立一个智能的搜索引擎.研究表明,该模型在对已经收录的文档有着86.1%的查准率.该智能搜索引擎较好的对查询语句的实现了理解,能够对用户的提问做出正确的回答.
[Abstract]:Aiming at the problems of traditional search engines in natural language understanding, a new model of intelligent search engine based on natural language processing technology and similarity calculation is studied in this paper. Its core technology is based on the natural language processing of Chinese word segmentation technology, semantic similarity and opposites and other theories, combining these concepts theory, from the perspective of user habits, Combined with DotLucene open source full-text search engine to establish an intelligent search engine. The results show that the model has an accuracy of 86.1% for the documents that have been included. The intelligent search engine has a good understanding of the query statements and can answer the user's questions correctly.
【作者单位】: 桂林理工大学信息科学与工程学院;太原科技大学机械电子工程学院;莫纳什大学管理学院;利物浦大学计算机科学系;西交利物浦大学计算机科学与软件工程系;
【基金】:广西自然科学基金资助项目(桂科自0991254)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前1条

1 李占波;廖继东;李华;;基于DotLucene的垂直搜索引擎的研究[J];微计算机信息;2007年24期

相关硕士学位论文 前1条

1 陈魁;智能搜索引擎系统的分析设计与开发[D];大连理工大学;2004年

【共引文献】

相关硕士学位论文 前1条

1 申峰;元数据技术在数字图书馆建设中的探索及应用[D];长春理工大学;2007年

【二级参考文献】

相关期刊论文 前10条

1 尤f ,李涓子,王作英;基于《知网》的中文信息结构抽取研究[J];计算机工程与应用;2002年18期

2 杜阿宁,方滨兴,胡铭曾,云晓春;中文交互式网络搜索引擎及其自学习能力[J];计算机工程与应用;2003年10期

3 周强,冯松岩;构建知网关系的网状表示[J];中文信息学报;2000年06期

4 胡俊峰 ,俞士汶;唐宋诗中词汇语义相似度的统计分析及应用[J];中文信息学报;2002年04期

5 闫翔,陈远;中文智能搜索引擎现状探析[J];情报科学;2002年12期

6 李玮,李利;Web搜索引擎与全文检索技术[J];情报科学;2003年05期

7 邱均平;余以胜;;基于知识库系统的智能搜索引擎研究[J];情报科学;2006年03期

8 韩圣龙;网络信息检索工具评价指标[J];情报学报;2001年04期

9 曹素华;Internet搜索引擎漫谈[J];山东图书馆季刊;2001年03期

10 李琳;搜索引擎信息检索功能与检索技巧[J];图书馆建设;2000年06期

相关硕士学位论文 前2条

1 段恩泽;基于统计的汉语自动分词系统[D];电子科技大学;2005年

2 南铉国;基于语句相似度计算的主观题自动评分技术研究[D];延边大学;2007年

【相似文献】

相关期刊论文 前10条

1 焦庆争;蔚承建;;一种可靠信任推荐文本分类特征权重算法[J];计算机应用研究;2010年02期

2 ;《中文信息学报》征稿简则[J];中文信息学报;2010年02期

3 ;2010国际信息技术与应用论坛征稿启事[J];计算机研究与发展;2010年02期

4 赵敏涯;;结合语言模型的自动文本分类的应用研究[J];计算机与现代化;2010年03期

5 彭炜明;宋继华;;《资治通鉴》历史领域本体构建及其应用研究[J];中文信息学报;2010年02期

6 郑魁;疏学明;袁宏永;;网络舆情热点信息自动发现方法[J];计算机工程;2010年03期

7 马连刚;夏克俭;;中医方剂与图集的转换的设计与实现[J];网络安全技术与应用;2010年02期

8 谌志群;;文本趋势挖掘综述[J];情报科学;2010年02期

9 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[J];情报学报;2010年01期

10 王磊;周宽久;仇鹏;;领域本体自动构建研究[J];情报学报;2010年01期

相关会议论文 前10条

1 李军辉;周国栋;朱巧明;钱培德;;一种改进的中文层次句法分析模型研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

2 彭洪保;李茹;段建勇;;基于汉语框架网的问句语义角色自动标注研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

3 缪建明;张全;;HNC句群处理研究新进展[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

4 王德亮;;语篇连贯性的量化测量——基于向心理论的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

5 罗琳;刘金凤;郭嘉伟;亢世勇;姜岚;;汉语文本蕴涵库的设想与实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

6 蒙新泛;王厚峰;;主客观识别中的上下文因素的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

7 夏云庆;郝博一;徐睿峰;;意见目标网络与意见目标抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

8 刘鸿宇;赵妍妍;秦兵;刘挺;;评价对象抽取及其倾向性分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

9 何赛克;王小捷;董远;张韬政;白雪;;归一化的邻接类别方法在基于条件随机场的中文分词中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

10 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

相关重要报纸文章 前10条

1 本报通讯员 周雨花 杨杰 本报记者 王握文;在线电子辞典,,网友也能当作者[N];解放军报;2009年

2 记者 毛江华;新浪借微软瞄准移动互联网[N];计算机世界;2009年

3 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年

4 焦敏 编译;自动语音识别决定呼叫中心的未来[N];中国计算机报;2009年

5 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年

6 李薇薇邋张楠;社会实践,顺利就业的重要砝码[N];中国教育报;2008年

7 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年

8 本报记者 赵齐;网络机器人提升政府公众服务形象[N];国际商报;2008年

9 康琦;专家指出:中医临床科研一体化需实现技术突破[N];中国医药报;2008年

10 本报记者 曹霁阳;微软与我高校合作渐入佳境[N];经济参考报;2008年

相关博士学位论文 前10条

1 袁彩霞;中文功能组块分析及应用研究[D];北京邮电大学;2009年

2 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年

3 方宁;基于认知的文本语境生成和度量研究[D];上海大学;2009年

4 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年

5 朱文浩;基于三维人脸特征的计算机辅助疾病诊断技术研究[D];浙江大学;2009年

6 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年

7 赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;2008年

8 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年

9 屈刚;英汉双语短语对齐[D];上海交通大学;2007年

10 戴祖旭;文本载体信息隐藏研究[D];华中科技大学;2007年

相关硕士学位论文 前10条

1 张正永;面向自然语言的普适地图服务研究和实现[D];华东师范大学;2010年

2 励子闰;基于Lucene搜索引擎的中文全文信息检索技术的研究[D];华东师范大学;2010年

3 周程远;中文自动分词系统的研究与实现[D];华东师范大学;2010年

4 高娟;基于K-means算法的文本聚类的研究与实现[D];江西理工大学;2010年

5 郑照阳;英语形容词认知研究[D];浙江大学;2010年

6 司红娜;文本挖掘技术研究及其在CRM系统中的应用[D];南昌大学;2010年

7 姜冶;对网页目录的分析以及相关算法的设计[D];吉林大学;2009年

8 颜军;基于条件随机场的中文分词研究与应用[D];武汉理工大学;2009年

9 王颖;中文局域网搜索引擎设计与实现[D];电子科技大学;2009年

10 刘延吉;基于词典的中文分词歧义算法研究[D];东北师范大学;2009年



本文编号:2341927

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2341927.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c40e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com