基于词袋模型的关联数据融合算法改进研究
[Abstract]:The word bag model is one of the most original and universally applicable algorithms for association data fusion. However, in this algorithm, the keyword matching has not utilized its own semantics and the corpus is insufficient, which leads to the low accuracy of entity links. In this paper, using knowledge base as background, semantic extension and cyclic iteration are used to enhance the speed and accuracy of entity disambiguation. The algorithm is divided into two processes. Firstly, the semantic fusion of the associated data set is carried out. Then, the semantic cyclic iterative word bag (s-i-Bo W) algorithm proposed in this paper is used to disambiguate and link entities. Experimental results show that the semantic cyclic iterative word bag algorithm proposed in this paper has a better correlation data fusion effect by comparing it with the associated data fusion algorithm based on the traditional word bag algorithm.
【作者单位】: 上海财经大学;上海外国语大学图书馆;
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 杨宪泽;谈文蓉;刘莉;;句型转换的消歧与译文生成处理研究[J];计算机工程与科学;2007年04期
2 冯素琴;陈惠明;;一种基于搭配信息的汉语组合型消歧方法[J];山西大学学报(自然科学版);2008年02期
3 刘鹏远;赵铁军;杨沐昀;李壮;;基于等价伪译词模型的无指导译文消歧研究[J];电子与信息学报;2008年07期
4 何文垒;刘功申;;基于语义密度的名词消歧算法[J];计算机科学;2012年06期
5 肖晶;梁冰;张晓丹;吕世炅;;一种面向篇级数据的作者名消歧规则和算法[J];现代图书情报技术;2012年05期
6 郭舒;;文献数据库中作者名消歧算法研究[J];现代图书情报技术;2013年Z1期
7 郭舒;;文献数据库中作者名自动化消歧方法应用研究[J];情报杂志;2013年09期
8 朱靖波,姚天顺;词义自动消歧概率模型[J];东北大学学报;2000年05期
9 冯素琴,刘丽萍;组合歧义消歧方法的深入研究[J];忻州师范学院学报;2003年05期
10 范明;胡国平;王仁华;;汉语字音转换中的多层面多音字读音消歧[J];计算机工程与应用;2006年02期
相关会议论文 前9条
1 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
2 方向红;宋春阳;;介连兼类词“以”的句法语义区别特征及消歧策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 陈建美;林鸿飞;杨志豪;;基于贝叶斯模型的词汇情感消歧[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 周云;王挺;易绵竹;王之元;;全词消歧的序列标注方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 李丽;孙甲申;王小捷;李江;宋占江;;基于属性信息的中文人名消歧[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 时迎超;王会珍;肖桐;胡明涵;;面向人名消歧任务的人名识别系统[A];第六届全国信息检索学术会议论文集[C];2010年
8 俞苏宁;;“同位词”体系能促进汉语消歧和丰富词汇[A];第六届汉语词汇语义学研讨会论文集[C];2005年
9 李斌;陈小荷;方芳;徐艳华;;高频最大交集型歧义字段问题研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
相关重要报纸文章 前1条
1 本报记者 王春霞;性别平等有助实现全面建设和谐社会[N];中国妇女报;2007年
相关博士学位论文 前3条
1 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
2 郭宇航;基于上下文的实体链指技术研究[D];哈尔滨工业大学;2014年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
相关硕士学位论文 前10条
1 江瑾;融合社会关系的属性图聚类专家消歧方法[D];昆明理工大学;2015年
2 姜新民;基于汉藏平行语料的藏文词义自动消歧方法研究[D];中央民族大学;2015年
3 杨光;基于图方法的命名实体消歧研究[D];哈尔滨工业大学;2015年
4 林翠萍;中文人名消歧算法研究[D];华侨大学;2015年
5 吴艳艳;统计和语义结合的中文介词消歧研究及其在机械产品设计中的应用[D];西安电子科技大学;2014年
6 雷晨曦;基于方式信息的自然语言篇章消歧方法及其在智能仪器设计中的应用[D];西安电子科技大学;2014年
7 相晓敏;中文组织机构名识别和消歧技术研究与应用[D];华东师范大学;2016年
8 杨华;生物医学缩略语消歧[D];苏州大学;2011年
9 李超;面向新闻领域的人名消歧方法研究[D];东北大学;2010年
10 田维;基于半监督图聚类的专家消歧方法研究[D];昆明理工大学;2013年
,本文编号:2454423
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2454423.html