当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于NLP技术和相似度计算的智能搜索引擎研究

发布时间:2018-11-19 09:52
【摘要】:针对传统的搜索引擎对于自然语言理解方面存在的问题,文章研究了一种新的基于自然语言处理技术和相似度计算的智能搜索引擎的模型.其核心技术是基于自然语言处理的中文分词技术、语义相似度和对立度等理论,将这些概念理论结合起来,从用户习惯的思考角度,结合DotLucene开源全文搜索引擎建立一个智能的搜索引擎.研究表明,该模型在对已经收录的文档有着86.1%的查准率.该智能搜索引擎较好的对查询语句的实现了理解,能够对用户的提问做出正确的回答.
[Abstract]:Aiming at the problems of traditional search engines in natural language understanding, a new model of intelligent search engine based on natural language processing technology and similarity calculation is studied in this paper. Its core technology is based on the natural language processing of Chinese word segmentation technology, semantic similarity and opposites and other theories, combining these concepts theory, from the perspective of user habits, Combined with DotLucene open source full-text search engine to establish an intelligent search engine. The results show that the model has an accuracy of 86.1% for the documents that have been included. The intelligent search engine has a good understanding of the query statements and can answer the user's questions correctly.
【作者单位】: 桂林理工大学信息科学与工程学院;太原科技大学机械电子工程学院;莫纳什大学管理学院;利物浦大学计算机科学系;西交利物浦大学计算机科学与软件工程系;
【基金】:广西自然科学基金资助项目(桂科自0991254)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前10条

1 杨倩晨;;浅析搜索引擎的运行机制[J];大众科技;2009年05期

2 吴晨;张全;缪建明;韦向峰;;语义理解下的自然语言处理及信息检索模型[J];计算机科学;2008年05期

3 陈林;杨丹;赵俊芹;;基于语义理解的智能搜索引擎研究[J];计算机科学;2008年06期

4 李玉梅;陈晓;姜自霞;易江燕;靳光瑾;黄昌宁;;分词规范亟需补充的三方面内容[J];中文信息学报;2007年05期

5 麦范金;王挺;;语义对立度及其计算模型的研究[J];中文信息学报;2008年04期

6 严良达;;基于Lucene搜索引擎的设计与实现[J];宁波职业技术学院学报;2009年02期

7 吴晓晖;宋萍萍;;中文智能搜索引擎分析和框架模型的设计[J];情报科学;2008年12期

8 蔡雷;;语料库技术在英语教学中的应用与研究[J];宿州学院学报;2008年05期

9 李占波;廖继东;李华;;基于DotLucene的垂直搜索引擎的研究[J];微计算机信息;2007年24期

10 麦范金;赵子强;岳晓光;;基于语义相似度的主观题阅卷系统模型设计[J];微计算机信息;2009年18期

相关硕士学位论文 前1条

1 陈魁;智能搜索引擎系统的分析设计与开发[D];大连理工大学;2004年

【共引文献】

相关期刊论文 前10条

1 田占霄;韩宪忠;王克俭;;一种改进的长词优先逆向最大匹配分词消歧策略[J];河北农业大学学报;2009年04期

2 陈洪猛;;基于垂直搜索技术的搜索引擎解决方案[J];电脑应用技术;2008年01期

3 陈文君;於文雪;;汉英跨语言检索系统中关键词提取方法的研究[J];电脑知识与技术;2009年28期

4 韦永军;覃秋密;;基于AJAX智能题库训练系统的设计与实现[J];电脑知识与技术;2011年23期

5 张兰芳;;一种基于本体的自然语言语义相似度算法[J];桂林理工大学学报;2012年02期

6 杨文刚;;基于Lucene.net的档案垂直搜索引擎的实现[J];北京档案;2012年10期

7 陆秋琴;黄光球;周娇;;基于生物记忆原理的个性化搜索引擎模型[J];计算机工程与应用;2012年12期

8 秦学勇;张润梅;;两级相似度计算在主观题机器阅卷中的应用[J];计算机工程;2012年11期

9 龚磊;武友新;;Lucene全文检索系统的研究与实现[J];计算机与数字工程;2010年05期

10 康大伟;;语料库在行业英语教学中的应用——以畜牧兽医专业为例[J];科教文汇(下旬刊);2009年12期

相关会议论文 前1条

1 李玉梅;靳光瑾;黄昌宁;;中文分词规范中的歧义字段消解细则[A];第五届全国语言文字应用学术研讨会论文集[C];2007年

相关博士学位论文 前2条

1 李滨;自然空间查询语言解译机制研究[D];解放军信息工程大学;2009年

2 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年

相关硕士学位论文 前10条

1 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年

2 么士宇;基于分布式计算的网络爬虫技术研究[D];大连海事大学;2011年

3 陆晓丹;基于.NET多层架构的内容管理系统的研究[D];太原科技大学;2011年

4 陈淑华;企业短信互动系统设计及实现关键技术研究[D];中南大学;2011年

5 陈杰;基于Web检索的查询意图分类研究[D];华南理工大学;2011年

6 陈建伟;基于语义的访问控制技术在信息整合中的研究[D];华北电力大学;2011年

7 曾微;基于网络语料库的大学生英语作文自我纠错研究[D];广西师范大学;2011年

8 张赢;个性化多媒体资源垂直搜索引擎技术研究[D];华东交通大学;2009年

9 余坦;个性化技术资料支持帮助系统的研究与实现[D];湖南大学;2009年

10 阴晓昱;基于Lucene多核并行索引方法的设计与实现[D];上海交通大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 何安平;;语料库与外语教学[J];国外外语教学;2001年03期

2 刘春辰;刘大有;王生生;赵静滨;王兆丹;;改进的语义相似度计算模型及应用[J];吉林大学学报(工学版);2009年01期

3 尤f ,李涓子,王作英;基于《知网》的中文信息结构抽取研究[J];计算机工程与应用;2002年18期

4 杜阿宁,方滨兴,胡铭曾,云晓春;中文交互式网络搜索引擎及其自学习能力[J];计算机工程与应用;2003年10期

5 周强,冯松岩;构建知网关系的网状表示[J];中文信息学报;2000年06期

6 胡俊峰 ,俞士汶;唐宋诗中词汇语义相似度的统计分析及应用[J];中文信息学报;2002年04期

7 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范[J];中文信息学报;2002年05期

8 闫翔,陈远;中文智能搜索引擎现状探析[J];情报科学;2002年12期

9 李玮,李利;Web搜索引擎与全文检索技术[J];情报科学;2003年05期

10 邱均平;余以胜;;基于知识库系统的智能搜索引擎研究[J];情报科学;2006年03期

相关硕士学位论文 前2条

1 段恩泽;基于统计的汉语自动分词系统[D];电子科技大学;2005年

2 南铉国;基于语句相似度计算的主观题自动评分技术研究[D];延边大学;2007年

【相似文献】

相关期刊论文 前10条

1 梁晓诚;岳晓光;麦范金;赵子强;路英;王挺;;基于自然语言处理的主观题评分算法研究[J];昆明理工大学学报(理工版);2010年02期

2 田甜;张振国;;主观题自动阅卷技术研究[J];计算机工程与设计;2010年16期

3 麦范金;岳晓光;赵子强;路英;王挺;岳砥柱;;基于自然语言处理的智能评分系统[J];桂林理工大学学报;2010年03期

4 佘莉,符红光,方海光;几何命题处理中的中文分词技术[J];计算机工程;2005年18期

5 石正喜;张捍东;赵黎明;陈玉燕;;一种改进的MM中文分词算法[J];计算机与网络;2009年02期

6 吉胜军;;基于Levenshtein distance算法的句子相似度计算[J];电脑知识与技术;2009年09期

7 仲兆满;刘宗田;周文;付剑锋;;基于事件的文本相似度计算[J];广西师范大学学报(自然科学版);2009年01期

8 周法国;杨炳儒;;句子相似度计算新方法及在问答系统中的应用[J];计算机工程与应用;2008年01期

9 南铉国;崔荣一;;基于多层次融合的语句相似度计算模型[J];延边大学学报(自然科学版);2007年03期

10 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期

相关会议论文 前10条

1 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

2 刘宝艳;林鸿飞;杨志豪;;基于改进编辑距离和依存结构的句子相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年

3 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年

4 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

5 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年

6 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

7 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

8 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

9 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年

10 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

相关重要报纸文章 前10条

1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年

2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年

3 李瀛寰;雅虎中文搜索从分词开始[N];中国计算机报;2006年

4 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年

5 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年

6 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年

7 邓健;智能计算:变数据为情报[N];计算机世界;2007年

8 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年

9 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年

10 张利;下一代搜索轮廓初现Autonomy力挺中文搜[N];中国企业报;2006年

相关博士学位论文 前10条

1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年

2 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年

3 计峰;自然语言处理中序列标注模型的研究[D];复旦大学;2012年

4 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年

5 赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;2008年

6 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年

7 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年

8 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年

9 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

10 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年

相关硕士学位论文 前10条

1 刘岩;基于概念图的中文语义分析系统的研究与实现[D];西北大学;2008年

2 王利局;基于语义分析树核的句子相似度计算[D];大连理工大学;2008年

3 唐琦;基于语义分析的句子相似度计算研究[D];华北电力大学(北京);2009年

4 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年

5 杨国基;汉语中基于短语结构的语义提取[D];天津大学;2007年

6 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年

7 王德刚;智能答疑系统的设计[D];内蒙古大学;2008年

8 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年

9 杨聪;基于口语对话的电话自动转接与信息查询技术研究[D];国防科学技术大学;2004年

10 南铉国;基于语句相似度计算的主观题自动评分技术研究[D];延边大学;2007年



本文编号:2341926

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2341926.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c40e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com