当前位置:主页 > 科技论文 > 软件论文 >

基于语义上下文的互联网金融搜索引擎研究

发布时间:2021-03-24 20:20
  搜索引擎是用户最常用的信息查询工具之一。随着用户对搜索结果准确性要求的提升,基于关键词匹配和排序算法的传统搜索引擎暴露出搜索结果与用户需求语义关联性低的问题,无法"理解"用户查询意图与网页内容的内在联系。因此,为了更好地解决由语义关联性低引起的搜索效果差的问题,本文提出了基于语义上下文的搜索引擎模型。首先,本文利用主题模型建立非结构化文档与潜在主题向量的映射关系,并结合词项权重模型优化了传统搜索引擎的索引空间。接下来,根据文档生成模型对优化词项后的语料库进行语言建模,通过主题模型和神经网络语言模型分别对搜索关键词的语义和上下文进行扩展。然后,对传统搜索引擎使用关键词的搜索方法进行拓展,并对扩展后的语义上下文进行搜索。最后,结合文档相关性排序模型,基于带权语义上下文进行文档相关度计算并排序,返回搜索结果。本文通过在互联网金融新闻类非结构化数据集上的实验,与传统搜索引擎在索引空间、搜索结果、搜索性能等方面进行了对比分析。结果表明,基于语义上下文搜索引擎索引空间更小,且能提供更准确的搜索服务。 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

基于语义上下文的互联网金融搜索引擎研究


图1-1信息检索系统基本结构图??W,,

基于语义上下文的互联网金融搜索引擎研究


图1-4自学习排序模型示意图??

基于语义上下文的互联网金融搜索引擎研究


图2-1化geRank在Google的巧用示意图??

【参考文献】:
期刊论文
[1]Word2vec的核心架构及其应用[J]. 熊富林,邓怡豪,唐晓晟.  南京师范大学学报(工程技术版). 2015(01)
[2]Word2vec的工作原理及应用探究[J]. 周练.  科技情报开发与经济. 2015(02)
[3]国外语义搜索引擎调查与分析[J]. 郭卫宁,司莉.  图书情报工作. 2013(23)
[4]传统搜索引擎与语义搜索引擎服务比较研究[J]. 赵夷平.  情报科学. 2010(02)
[5]网络搜索引擎分类与发展[J]. 杨丽萍,马继涛,张虹霞.  情报学报. 2006 (S1)



本文编号:3098333

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3098333.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户81bc9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com