当前位置:主页 > 科技论文 > 软件论文 >

文献数据库中作者同名消歧研究

发布时间:2022-02-19 06:13
  近年来,随着信息技术的快速发展,网络上的数据信息越来越多,通过搜索引擎进行信息检索是用户获取目标信息的主要方法之一,而在文献数据库中针对作者姓名的搜索又是最常见的搜索方式之一,但是由于一个姓名可能被多个作者使用,或者是一个作者使用了多个姓名变体,对于某一个特定姓名进行搜索时,系统会返回与此姓名相关的所有记录,用户需要进一步的筛选获取自己感兴趣的信息,这样信息检索的效率以及用户的体验感都会下降,这类姓名歧义问题称为作者同名问题。在文献搜索系统中,作者同名问题会影响信息检索的效率,也会影响对学者研究工作的正确归属,因此作者同名消歧问题成为了近年来国内外学者的研究热点之一。许多领域的研究者都曾深入的研究过作者同名消歧问题并提出各种各样的解决方法。尽管作者同名消歧问题已经取得了一些进展,但是仍然存在很多挑战:(1)大多数监督的消歧方法由于利用了标注的信息,消歧性能一般要比非监督的消歧方法好,但是现实生活中的数据集规模都比较大,监督信息需要人工地进行标注,耗费大量的人力,财力和时间,而非监督的方法由于可利用的信息比较有限,难以获得较好的消歧性能。因此在没有标注信息的前提下如何利用文献的属性信息提... 

【文章来源】:山东大学山东省211工程院校985工程院校教育部直属院校

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景以及意义
    1.2 作者同名消歧面临的问题
    1.3 本文的主要工作
    1.4 本文的组织结构
第二章 相关研究与技术
    2.1 引言
    2.2 问题定义
    2.3 相关研究
        2.3.1 机器学习相关的消歧方法
        2.3.2 概率相关的消歧方法
        2.3.3 基于图的消歧方法
    2.4 相关技术
        2.4.1 图上的随机游走
        2.4.2 层次聚类
        2.4.3 图自编码器
    2.5 本章小结
第三章 基于文献属性的作者同名消歧方法
    3.1 引言
    3.2 方法介绍
    3.3 算法设计与实现
        3.3.1 全局表示学习
        3.3.2 局部嵌入学习
        3.3.3 局部链接学习
    3.4 实验设置以及结果分析
        3.4.1 数据集
        3.4.2 基线方法
        3.4.3 实验结果及分析
        3.4.4 组件贡献分析
    3.5 本章小结
第四章 基于合作者关系的作者同名消歧方法
    4.1 引言
    4.2 方法介绍
    4.3 算法设计与实现
        4.3.1 词表示学习法
        4.3.2 图节点表示学习算法
        4.3.3 复杂度分析
    4.4 实验设置以及结果分析
        4.4.1 数据集
        4.4.2 基线方法
        4.4.3 实验设置
        4.4.4 实验结果及分析
        4.4.5 参数敏感性和扩展性实验
    4.5 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
攻读学位期间发表的学术论文
攻读学位期间获奖情况
学位论文评阅及答辩情况表


【参考文献】:
期刊论文
[1]文献数据库中作者名消歧算法研究[J]. 郭舒.  现代图书情报技术. 2013(Z1)



本文编号:3632374

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3632374.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3c65a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com