当前位置:主页 > 管理论文 > 移动网络论文 >

基于Web的人物信息搜索关键问题研究

发布时间:2017-04-25 02:11

  本文关键词:基于Web的人物信息搜索关键问题研究,由笔耕文化传播整理发布。


【摘要】:互联网技术的快速发展和网络数据的爆发式增长,使得Web上积累了海量的信息资源,Web成为人们获取信息的重要渠道。人是客观活动的主体,人物信息是一种很重要的资源,通过Web对人物信息进行搜索是一种很常见的行为。但是海量的信息存在同时增加信息搜索的难度,如何准确、快速、全面的把人们所需要的信息呈现出来是一个急需解决的问题。 通用搜索技术某种程度上满足了人们对人物信息搜索需求,但仍存在着一些问题:社交媒体上存在大量的人物信息,但由于其特殊性,普通的信息获取方式并不适用;人物存在重名现象,通用搜索引擎基于关键字匹配的排名方式,使得其对人物重名问题的解决无能为力。 本文对上述两个关键问题进行了研究,具体研究内容如下: 面向社交网站的个人信息搜索方法研究:对社交网站平台和相关技术进行了详细调研,提出网页解析和API查询相结合的方法。实现了跨平台的社交网站个人信息搜索系统,该系统通过属性匹配的方式解决人名歧义问题,并对提取的信息进行建模保存。 Web人物搜索中的人名消歧方法研究:在总结前人相关工作的基础上,提出了一种基于组合特征的Web人名消歧方法,该方法通过提取人物网页不同的特征信息,利用空间向量模型构造组合特征向量,依据特征向量间的相似度比较,运用层次聚类的方法实现人名消歧。 Web人名消歧原型系统的设计与实现:在对Web人名消歧方法进行研究的基础上,研发了一个Web人名消歧原型系统。该工具接收人名输入,运用本文所提的人名消歧方法对通用搜索引擎的人名检索结果进行人名消歧,实现以聚类特征为标签的再排功能。在该原型系统上的实验表明,通过特征组合的方式增加聚类特征的准确性,可以有效地提高人名消歧效果。
【关键词】:Web人物搜索 社交网站 信息搜索 人名消歧 层次聚类
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
  • 摘要5-6
  • ABSTRACT6-12
  • 第1章 引言12-18
  • 1.1 研究背景与意义12-13
  • 1.2 国内外研究现状13-16
  • 1.3 研究内容16-17
  • 1.4 论文结构17-18
  • 第2章 相关概念与技术基础18-26
  • 2.1 信息检索简介18-19
  • 2.1.1 信息检索18
  • 2.1.2 Web信息检索18-19
  • 2.2 社交网络相关概念19-22
  • 2.2.1 Deep Web概念19-20
  • 2.2.2 Deep Web数据获取技术20-21
  • 2.2.3 OAuth授权21-22
  • 2.3 网页清洗技术22-23
  • 2.4 文本表示模型23-24
  • 2.5 小结24-26
  • 第3章 社交网络人物信息搜索方法研究26-38
  • 3.1 社交网络平台特殊性26
  • 3.2 社交网络人物信息搜索方法26-29
  • 3.3 社交网络人物信息搜索系统29-36
  • 3.3.1 社交网络人物信息搜索系统设计29-30
  • 3.3.2 社交网络人物信息搜索系统实现30-35
  • 3.3.3 实验与分析35-36
  • 3.4 小结36-38
  • 第4章 基于组合特征的Web人名消歧方法研究38-46
  • 4.1 Web人名消歧定义38-39
  • 4.2 Web人名消歧框架及方法39-45
  • 4.2.1 网页预处理40
  • 4.2.2 特征提取40-41
  • 4.2.3 组合特征向量构建41-43
  • 4.2.4 聚类算法43-45
  • 4.3 小结45-46
  • 第5章 Web人名消歧原型系统设计与实现46-60
  • 5.1 Web人名消歧系统总体设计46-47
  • 5.2 Web人名消歧系统详细设计与实现47-53
  • 5.2.1 Web人物网页获取模块47-49
  • 5.2.2 网页文本处理模块49-50
  • 5.2.3 人名消歧模块50-51
  • 5.2.4 主要类结构51-53
  • 5.3 实验与分析53-59
  • 5.3.1 实验数据53-54
  • 5.3.2 评测标准54
  • 5.3.3 实验过程与分析54-59
  • 5.4 小结59-60
  • 第6章 总结与展望60-62
  • 6.1 总结60-61
  • 6.2 展望61-62
  • 参考文献62-66
  • 致谢66-68
  • 在读期间发表的学术论文与取得的研究成果68

【参考文献】

中国期刊全文数据库 前5条

1 郎君;秦兵;宋巍;刘龙;刘挺;李生;;基于社会网络的人名检索结果重名消解[J];计算机学报;2009年07期

2 王英帅;李培峰;朱巧明;;一种基于LDA和上下文摘要的Web人名消歧方法[J];计算机应用与软件;2011年07期

3 杨欣欣;李培峰;朱巧明;;基于网页文本依存特征的人名消歧[J];计算机工程;2012年19期

4 李广建,黄];元搜索引擎及其主要技术[J];情报科学;2002年02期

5 肖冬梅;垂直搜索引擎研究[J];图书馆学研究;2003年02期


  本文关键词:基于Web的人物信息搜索关键问题研究,,由笔耕文化传播整理发布。



本文编号:325391

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/325391.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c961f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com