基于个性化的语义检索的新关键技术研究
发布时间:2017-12-19 09:38
本文关键词:基于个性化的语义检索的新关键技术研究
更多相关文章: 语义检索 多分类语义分析 个性化算法 词向量库
【摘要】:随着互联网信息容量的爆炸式增长,信息检索的重要性日益凸显。互联网信息检索技术采用一定的策略、运用特定的计算机算法从互联网上获取信息,在对信息进行组织和处理后,将与用户检索相关的信息展示出来。如今,网络搜索引擎已经成为了人们从互联网上获取信息的主要途径。 但是,当今主流的搜索引擎如Google, Baidu, MSN, Bing, Yahoo等均是基于关键字和词频统计的检索系统,在很多方面仍难以使用户得到满意的体验。主要表现在:首先,对于一般的查询,返回大量无用链接的情况很普遍;其次,由于用户人群的多样性,单一的检索结果通常不能针对性的满足每个用户的特殊需要。最后,搜索过程不考虑词之间的语义相关度,且搜索结果没有有效地按某种方式组织起来,用户不得不费时费力的浏览和挑选。在信息检索领域内获得极大重视的语义检索技术可以有效地解决或减轻上述问题。 语义搜索作为一种新型的不同于基于关键字搜索的搜索方式,不再拘泥于用户所输入请求语句的关键字本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行分析和搜索。因而,这种检索方式能更准确地向用户返回最符合其需求的结果,相比传统的搜索方式具有独到的优势。目前基于个性化的语义检索领域的研究仍存在一些问题。例如,在基于分类的个性化方法中,需要用户长期使用来积累数据,具有一定的局限性;其次,没有考虑到用户不同个人信息的重要程度;最后,提取用户数据的方法有待进一步细化和改进。 本文通过深入研究语义检索领域的前沿技术和已有成果,提出了一种新型的基于个性化和语义分类技术的语义检索框架。本文的研究内容成果主要包括以下几个方面: 研究并提出了一种适用于多分类的语义分析方法,在获得更高的效率的同时,简化分析过程中文档向量的表示过程,并提出了“词向量库”的概念。同时,在个性化部分的工作中,提出了“匹配”的思想,并提出了基于此思想的一系列有效地个性化算法。文章最后,进行了实验和分析。实验结果表明,本文方法能够一定程度上提高检索效果,并且额外的时间消耗也在合理的范围内。
【学位授予单位】:华北电力大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【参考文献】
中国期刊全文数据库 前5条
1 李广建,黄];元搜索引擎及其主要技术[J];情报科学;2002年02期
2 曹勇刚;曹羽中;金茂忠;刘超;;面向信息检索的自适应中文分词系统[J];软件学报;2006年03期
3 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
4 周顺先;林亚平;王耀南;易叶青;;基于聚簇隐马尔可夫模型的文本信息抽取[J];系统仿真学报;2007年21期
5 黄昌宁;中文信息处理中的分词问题[J];语言文字应用;1997年01期
,本文编号:1307752
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1307752.html