当前位置:主页 > 科技论文 > 软件论文 >

基于词向量语义分类的微博实体链接方法

发布时间:2017-06-19 18:02

  本文关键词:基于词向量语义分类的微博实体链接方法,由笔耕文化传播整理发布。


【摘要】:微博实体链接是把微博中给定的指称链接到知识库的过程,广泛应用于信息抽取、自动问答等自然语言处理任务(Natural language processing,NLP).由于微博内容简短,传统长文本实体链接的算法并不能很好地用于微博实体链接任务.以往研究大都基于实体指称及其上下文构建模型进行消歧,难以识别具有相似词汇和句法特征的候选实体.本文充分利用指称和候选实体本身所含有的语义信息,提出在词向量层面对任务进行抽象建模,并设计一种基于词向量语义分类的微博实体链接方法.首先通过神经网络训练词向量模板,然后通过实体聚类获得类别标签作为特征,再通过多分类模型预测目标实体的主题类别来完成实体消歧.在NLPCC2014公开评测数据集上的实验结果表明,本文方法的准确率和召回率均高于此前已报道的最佳结果,特别是实体链接准确率有显著提升.
【作者单位】: 北京理工大学计算机学院;北京市海量语言信息处理与云计算应用工程技术研究中心;
【关键词】词向量 实体链接 社会媒体处理 神经网络 多分类
【基金】:国家重点基础研究发展计划(973计划)(2013CB329303) 国家高技术研究发展计划(863计划)(2015AA015404) 国家自然科学基金(61502035) 高等学校博士学科点专项科研基金(20121101120026)资助~~
【分类号】:TP391.1;TP393.092
【正文快照】: 微博是一种通过关注机制分享简短实时信息的广播式的社交网络平台,已成为目前最流行的社交 平台之一.截至2014年9月30日,微博的月活跃用户已经达到1.67亿,用户每天产生的微博数目达到2亿[1].如何从海量微博中自动地及时分析、获得信息已成为研究和应用热点问题,微博实体链接

【相似文献】

中国期刊全文数据库 前10条

1 奚伟鹏,李昕,武港山;超链语义分类系统的设计与实现[J];计算机应用研究;2004年11期

2 左云存;宗成庆;;基于语义分类树的汉语口语理解方法[J];中文信息学报;2006年02期

3 乔荣华;周明全;耿国华;;基于语义分类的文物图像标注研究[J];计算机技术与发展;2007年07期

4 邢玲;贺梅;马强;朱敏;;基于张量神经网络的音频多语义分类方法[J];计算机应用;2012年10期

5 朱虹;吴云芳;;基于语义分类体系的信息分类编码标准分类框架研究[J];标准科学;2011年10期

6 魏维;徐建;刘凤玉;许满武;;具有多峰正态分布属性的视频语义分类研究[J];计算机科学;2006年04期

7 许天兵;基于Bayes算法实现图像语义分类[J];微型机与应用;2004年11期

8 李旭明;戴青云;曹江中;曹璐;;基于语义分类的外观专利图像快速检索系统[J];计算机工程与应用;2012年16期

9 印勇;吕轶超;;图像语义分类的树结构SVM方法[J];计算机工程与应用;2012年12期

10 罗安;王勇;张福浩;刘纪平;;基于角色标注的中文POI名称语义分类方法[J];测绘通报;2012年S1期

中国重要会议论文全文数据库 前9条

1 陈洁;毕玉德;李琳;;现代韩国语“控制”类动词下位语义分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年

2 闫丹辉;;越南语动词语义分类研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

3 海银花;那顺乌日图;;面向“蒙古语语义信息词典”的名词语义分类体系[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

4 马永腾;亢世勇;;新编同义词词林语义分类体系[A];第三届学生计算语言学研讨会论文集[C];2006年

5 管芳;刘志洪;顾宁;宗宇伟;丁志刚;张绍华;张泉;;船舶工程图纸的语义分类与查询[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

6 孙季丰;邱卫东;余卫宇;余英林;;基于神经网络的图像语义分类的研究[A];第十三届全国图象图形学学术会议论文集[C];2006年

7 高凤荣;杜小勇;王珊;;数字图书馆环境下一种基于语义分类的个性化推荐算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

8 罗安;王勇;张福浩;刘纪平;;基于角色标注的中文POI名称语义分类方法[A];第四届“测绘科学前沿技术论坛”论文精选[C];2012年

9 易绵竹;姚爱钢;刘万义;;从计算语义学角度看俄语形容词的语义分类问题[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

中国硕士学位论文全文数据库 前7条

1 高彦;语义分类方法在淘宝评论文本中应用研究[D];河北大学;2015年

2 曾雪强;潜在语义分类模型的研究[D];江西师范大学;2005年

3 桑小川;基于语义的图像检索技术研究[D];西安电子科技大学;2007年

4 何婕;二叉树多分类SVM及其在图像语义分类中的应用[D];重庆师范大学;2012年

5 袁树明;基于自然语言理解的车辆行驶指令抽取[D];北京邮电大学;2013年

6 杜骞;深度学习在图像语义分类中的应用[D];华中师范大学;2014年

7 扎西草;藏语藻饰词信息库构建研究[D];西北民族大学;2014年


  本文关键词:基于词向量语义分类的微博实体链接方法,由笔耕文化传播整理发布。



本文编号:463272

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/463272.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f7c45***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com