基于学术网络的学者兴趣标签发现研究

发布时间:2020-12-27 12:09
  用户画像是对用户信息标签化,用户形象具体化的过程,在智能营销、计算广告、个性化推荐等领域得到了广泛的应用。兴趣标签是用户画像的基本内容之一,通过给用户打标签的方式刻画用户兴趣偏好,捕捉用户兴趣变化。学术研究的快速发展导致了学术大数据的产生,基于这些数据,可以构建学者的研究兴趣画像。以往的研究主要是从学术文本数据中提取学者的兴趣标签,相比之下,基于学术网络发现学者兴趣的研究较少。因此,本文假定在兴趣标签空间已知的前提下,将学者研究兴趣的发现问题抽象为一个多标签分类问题,通过构建以学者为节点的大规模无向合著网络、有向合著网络及引用网络,并针对合著网络和引用网络规模、结构不同的特点,分别应用不同的网络表示学习方法从3种学术网络中提取学者节点的特征表示,进而设计实现多标签分类模型,为学术网络中标签未知的学者标注最合适的兴趣标签。本文的主要工作包括以下三个方面:(1)基于Biendata提供的“2017开放学术精准画像大赛”论文信息数据集及爬取自微软学术网的计算机科学顶级领域标签数据,构建包含百万级节点与千万级边的合著网络和引用网络,为了更准确地识别无向合著网络中的核心学者,构建以论文中第一作者... 

【文章来源】:西北师范大学甘肃省

【文章页数】:76 页

【学位级别】:硕士

【部分图文】:

基于学术网络的学者兴趣标签发现研究


所示,Skip-gram模型是一个简单的三层前馈神经网络,其包含3个部分:输入层、隐藏层和输出层

频次分布,标签,频次分布,学者


第3章学术网络特征表示学习建模21表3-3学者的姓名及其顶级研究领域的兴趣标签数据样式idauthortag1tag2tag30DanielJ.PaulishprogramminglanguagesoftwareengineeringNULL1JoséCristóbalRiquelmeSantosmachinelearningalgorithmNULL2FernandoC.N.Pereiraspeechrecognitionnaturallanguageprocessingcomputerhardware3JuandeLaraalgorithmsoftwareengineeringcomputerhardware4StefanoLonardidatasciencedataminingcomputernetwork5SimeonJ.Simoffcomputervisiondatabaseprogramminglanguage6JinxiangChaicomputervisionmultimediaNULL7ShanlinYangalgorithmdistributedcomputingNULL8DairokuSekiguchisimulationmultimediacomputergraphics(images)9WilliamE.Bilesalgorithmsimulationdatamining建立细分研究领域标签到顶级领域标签的映射关系后,就可以将15367名学图3-115367名学者的顶级领域标签频次分布状况

趋势图,论文,趋势,标签


西北师范大学硕士学位论文22者的3个细分领域标签对应到顶级领域,表3-3展示了将表3-2中10位学者的细分领域标签对应到顶级领域标签后的结果。如表3-3所示,部分学者的细分领域标签在对应到顶级领域标签后,出现了一个或多个标签为空(NULL)的现象,原因在于一位学者的多个细分领域标签可能属于同一个顶级领域标签,因此,这种标签映射关系是一种一对一或多对一的关系。对学者论文信息数据papers_dataset、15367位学者及其顶级研究领域的兴趣标签数据以及34维的标签空间数据经过处理存储到数据库后,就可以基于这些数据构建学术网络进而开展后续的研究内容。3.2学术网络构建与分析3.2.1学术网络构建1.合著网络构建通过对papers_dataset中的合著情况统计发现,存在合著情况的论文共有2535624篇,其中合著者人数为2人的论文数量最多,共计908177篇;合著者人数为10人以上的论文数量共计12153篇。图3-2描述了papers_dataset中论文篇数随合著者人数变化的趋势:图3-2论文篇数随合著者人数变化的趋势

【参考文献】:
期刊论文
[1]结合词向量和词图算法的用户兴趣建模研究[J]. 聂卉.  数据分析与知识发现. 2019(12)
[2]基于LDA主题模型的用户兴趣层级演化研究[J]. 夏立新,曾杰妍,毕崇武,叶光辉.  数据分析与知识发现. 2019(07)
[3]面向学术文献的学者兴趣标签识别方法[J]. 谢鹏.  情报工程. 2019(03)
[4]基于手势行为的社交网络用户兴趣画像构建及应用[J]. 汪强兵,章成志.  图书与情报. 2019(02)
[5]网络表示学习的研究与发展[J]. 尹赢,吉立新,黄瑞阳,杜立新.  网络与信息安全学报. 2019(02)
[6]基于学术论文的学者研究兴趣标签发现研究[J]. 池雪花,刘丽帆,章成志.  情报工程. 2019(02)
[7]网络表示学习算法的分析与验证[J]. 王岩,唐杰.  中文信息学报. 2019(02)
[8]科研学术大数据的精准服务架构设计[J]. 谢靖,钱力,师洪波,孔贝贝,胡吉颖.  数据分析与知识发现. 2019(01)
[9]异构社交网络用户兴趣挖掘方法[J]. 屠守中,闫洲,卫玲蔚,朱小燕.  西安电子科技大学学报. 2019(02)
[10]开放互联网中的学者画像技术综述[J]. 袁莎,唐杰,顾晓韬.  计算机研究与发展. 2018(09)

硕士论文
[1]基于用户兴趣模型和社团挖掘的推荐方法研究[D]. 李鹏.兰州大学 2019
[2]基于多源异构大数据的学者用户画像关键技术研究[D]. 温昂展.华南理工大学 2018
[3]融入社交网络信息的DIT用户偏好预测模型[D]. 张长红.浙江工商大学 2018



本文编号:2941708

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2941708.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a6579***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com