当前位置:主页 > 社科论文 > 图书档案论文 >

智能搜索引擎中的同义词识别算法研究

发布时间:2020-10-17 14:43
   本文概述了对搜索引擎特别是中文搜索引擎的相关研究,分析了下一代 智能搜索引擎的功能特点,并尝试利用相似度算法实现智能搜索引擎中的概 念的识别。 关键词检索是大多数搜索引擎的主要检索手段,然而多数搜索引擎对此 不加控制。从情报语言学研究的成果以及网络信息检索的现状来看,自然语 言不加以控制,检索效率与效果是不能尽如人意的。应该说,要克服关键词 检索系统的弊病,必须对关键词进行有效的控制,变字面检索为概念检索。 本文在对字面相似度识别算法的深入分析基础上,提出了基于词素的语 义识别算法。该算法首先将复合词切分为词素,并在此基础上对词素进行语 义分解和标注来进行同义判别。其主要依据是,对标引关键词的切分统计表 明,专业领域中的大多数复合词可由数量有限的词素组配而成,通过建立一 个专业性的词素语义信息词典,可以将复合词切分为词素,再转换为事先设 计好的语义范畴代码,在相似度计算时以语义代码的比较代替字面的比较, 突破了以往字面相似度算法的一些局限。 通过与字面相似度算法进行对比测试,证明该算法具有相对较高的识别 率,对搜索引擎的概念检索有一定的应用价值。
【学位单位】:南京农业大学
【学位级别】:硕士
【学位年份】:2001
【中图分类】:G354
【文章目录】:
引 言
第一章 搜索引擎现状分析与研究概况
    第一节 搜索引擎概述
    第二节 中文搜索引擎的相关研究
    第三节 汉语同义词识别研究概况
第二章 智能搜索引擎的功能分析
    第一节 目前中文搜索引擎的不足与思考
    第二节 搜索引擎的发展方向
    第三节 智能搜索引擎的基本特征
    第四节 智能搜索引擎的语义网络结构
第三章 同义词识别算法研究
    第一节 字面相似度算法分析
    第二节 同义词算法改进
    第三节 同义词识别的改进
第四章 词素切分技术研究
    第一节 分词技术研究现状
    第二节 词素切分技术
第五章 词素语义信息词典的设计
    第一节 词素词典的建立
    第二节 语义体系的设计
第六章 同义词识别实验系统与效果测评
    第一节 系统功能
    第二节 系统同义词识别效果评测
附件1 语义分类体系
附件2 词素信息词典样例
附件3 相似度识别结果
参考文献

【引证文献】

相关期刊论文 前10条

1 章成志;一种基于语义体系的同义词识别研究[J];淮阴工学院学报;2004年01期

2 常娥;侯汉清;曹玲;;古籍自动校勘的研究和实现[J];中文信息学报;2007年02期

3 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[J];中文信息学报;2012年03期

4 陆勇,侯汉清;用于信息检索的同义词自动识别及其进展[J];南京农业大学学报(社会科学版);2004年03期

5 查贵庭,侯汉清;基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验[J];情报学报;2002年03期

6 傅魁;聂规划;;面向文本的本体学习方法综述[J];情报杂志;2008年09期

7 宋乐平;;文献数据库中词汇控制研究综述[J];图书馆;2012年05期

8 杨贺;杨奕虹;乔晓东;李宁;朱礼军;;用于计算机辅助文献标引加工系统的自然语言词表构建[J];现代图书情报技术;2010年06期

9 刘友华;黄芳;张克状;李寅;;基于链接结构和共现分析识别同义词的改进方法[J];信息系统学报;2009年02期

10 孙海霞;吴英杰;李军莲;李丹亚;;中文关键词-主题词自动映射方法研究综述[J];医学信息学杂志;2012年03期


相关博士学位论文 前2条

1 常娥;古籍智能处理技术研究[D];南京农业大学;2007年

2 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年


相关硕士学位论文 前10条

1 吴波;改进的编辑距离算法的研究及其在电子政务中的应用[D];电子科技大学;2011年

2 张书娟;基于电子商务用户行为的同义词识别[D];哈尔滨工业大学;2011年

3 宁可为;基于分布式技术的远程教育自动答疑系统的设计与开发[D];新疆师范大学;2011年

4 刘浩一;基于中文自然语言查询的多媒体数据库检索系统[D];山东师范大学;2006年

5 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年

6 杜慧平;自然语言叙词表自动构建研究[D];南京农业大学;2007年

7 徐芳;利用概念检索实现专业搜索引擎的智能化[D];北京化工大学;2008年

8 仲云云;电子政务主题词表的构建及应用研究[D];南京农业大学;2007年

9 陈靖;垂直育儿搜索引擎研究[D];西南大学;2010年

10 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年



本文编号:2844926

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2844926.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6e81e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com