当前位置:主页 > 科技论文 > 软件论文 >

一种基于复杂网络的短文本语义相似度计算

发布时间:2017-08-08 22:23

  本文关键词:一种基于复杂网络的短文本语义相似度计算


  更多相关文章: 复杂网络 综合特征值 短文本 语义相似度


【摘要】:将传统的文本相似度量方法直接移植到短文本时,由于短文本内容简短的特性会导致数据稀疏而造成计算结果出现偏差。该文通过使用复杂网络表征短文本,提出了一种新的短文本相似度量方法。该方法首先对短文本进行预处理,然后对短文本建立复杂网络模型,计算短文本词语的复杂网络特征值,再借助外部工具计算短文本词语之间的语义相似度,然后结合短文本语义相似度定义计算短文本之间的相似度。最后在基准数据集上进行聚类实验,验证本文提出的短文本相似度计算方法在基于F-度量值标准上,优于传统的TF-IDF方法和另一种基于词项语义相似度的计算方法。
【作者单位】: 中国人民大学信息学院;
【关键词】复杂网络 综合特征值 短文本 语义相似度
【基金】:国家自然科学基金(70871115)
【分类号】:TP391.1;O157.5
【正文快照】: 1引言文本聚类(Document clustering,or Text clus-tering)是指自动地将大规模数据集分组为多个类别,并使同一个类别中的文本信息之间具有较高的相似度,而不同类别之间的相似度较低[1]。作为文本挖掘的基础研究课题,文本聚类算法近年来得到系统研究及开发,并取得了一些良好的

【相似文献】

中国期刊全文数据库 前10条

1 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期

2 张兰芳;;一种基于本体的自然语言语义相似度算法[J];桂林理工大学学报;2012年02期

3 李燕妮;李海生;蔡强;;基于语义相似度的领域知识推荐研究[J];复杂系统与复杂性科学;2013年03期

4 赵捧未;袁颖;;基于领域本体的语义相似度计算方法研究[J];科技情报开发与经济;2010年08期

5 张会影;;语义网中本体语义相似度算法研究[J];蚌埠学院学报;2012年04期

6 唐一之;;基于知网的领域概念抽取与关系分析研究[J];湘潭大学自然科学学报;2009年01期

7 黄承慧;印鉴;陆寄远;;一种改进的Lucene语义相似度检索算法[J];中山大学学报(自然科学版);2011年02期

8 张怡文;程家兴;林京;岳丽华;王云;;社交网络中分类推荐用户的设计与实现[J];贵州师范大学学报(自然科学版);2013年01期

9 张阳;李绪成;;基于消息语义相似度二分匹配的Web服务发现方法[J];辽宁师范大学学报(自然科学版);2009年01期

10 谢雄程;刘之家;元昌安;;基于Wup的语义相似度计算的全局本体语义分析方法[J];井冈山大学学报(自然科学版);2011年01期

中国重要会议论文全文数据库 前10条

1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

2 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

3 冯新元;魏建国;路文焕;党建武;;引入领域知识的基于《知网》词语语义相似度计算[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

4 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

5 刘寒磊;关毅;徐永东;;多文档文摘中基于语义相似度的最大边缘相关技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

6 石静;邱立坤;王菲;吴云芳;;相似词获取的集成方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

7 陈明;鹿e,

本文编号:642335


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/642335.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c9821***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com