专业人才跨域搜索研究与应用
发布时间:2017-11-18 22:27
本文关键词:专业人才跨域搜索研究与应用
【摘要】:随着互联网的快速发展和普及,网络招聘越来越成为主流,对关于各专业技能人才搜索的垂直搜索引擎的研究十分有必要。但是随着各大招聘网站和技术论坛用户的快速增长,不用来源的简历数据或论坛用户的重复率越来越高,对这些不同领域用户的相互关联很有意义,因为它不仅可以简化招聘工作,还能对用户的个人信息进行完善。对于简历之间的相互关联,本文首先对简历集进行了分类,然后对简历之间各字段的相似度进行比较;而对于不同论坛用户之间的关联,可转化为多重网络之间的节点匹配问题,目前,该问题主要是根据网络的结构信息,利用不同网络节点连接的相同的已知匹配节点对的个数来求得不同网络节点对之间的初始相似度,然后就可以将该问题转化为图论中的带权二分图匹配的问题,最后利用KM算法即可对其最优匹配进行求解。本文根据现有数据的特点,在该匹配算法的基础上,对其节点对之间的初始相似度计算方法进行改进。主要是因为现有的数据不止有双层网络之间的结构关系,而且各网络节点(即用户)还有很多属性信息,例如发帖记录和标签等,利用这些属性信息可以对用户对之间的相似度计算进行优化。同时本文还通过缓存措施对搜索引擎过程中的索引建立速度进行了优化、通过技能同义词库对搜索进行了模糊搜索的优化并结合实际情况对搜索出的结果进行了排序,使得结果更符合人们的直观需要。最后通过对搜索结果进行分析,说明了改进后的搜索方式更能丰富用户搜索结果;改进后排序方式能使得更符合用户预期的人物排在前面;通过对选取的知乎和微博网络结构数据进行匹配并和原算法比较结果,体现了节点对间初始相似度计算的改进对匹配结果的优化。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【参考文献】
中国期刊全文数据库 前1条
1 郑冬冬,赵朋朋,崔志明;Deep Web爬虫研究与设计[J];清华大学学报(自然科学版);2005年S1期
,本文编号:1201413
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1201413.html