当前位置:主页 > 管理论文 > 移动网络论文 >

结合语义特征的个人微博聚类方法研究

发布时间:2019-11-13 20:15
【摘要】:针对个人微博聚类时缺乏考虑文本语义特征的问题,提出一种结合语义特征的个人微博聚类方法.该方法充分考虑了微博文本的语义特征,可将意义相关的微博更为准确地聚类.其要点如下:首先,利用随机游走算法产生每个词汇的语义标签及其概率,游走图基于知网的语义关系图产生;其次,利用排列算法将两篇微博中词汇的各个语义项进行相似度求解,得到意思集合;最后,利用余弦相似度计算两条微博的语义相关度,并将大于相似度阈值的聚在一起.为了提高算法效能,在计算微博的相似度时进行了分段和优化.实验表明,利用语义特征得到的聚类结果,F-度量值较利用词共现和word2vec聚类方法有明显地提高.

【相似文献】

相关期刊论文 前10条

1 郑炜冬;;试卷相似度自动评估技术的研究[J];智能计算机与应用;2011年06期

2 赵涛;肖建;;二型模糊相似度及其应用[J];计算机工程与应用;2013年08期

3 徐志明;李栋;刘挺;李生;王刚;袁树仑;;微博用户的相似性度量及其应用[J];计算机学报;2014年01期

4 李桂林,陈晓云;关于聚类分析中相似度的讨论[J];计算机工程与应用;2004年31期

5 秦玉平;杨兴凯;;基于案例推理的区间属性相似度研究[J];辽宁师范大学学报(自然科学版);2006年04期

6 蒋鹏;;基于本体的应急案例相似度算法研究[J];南昌高专学报;2009年03期

7 何亚;;词语相似度算法的分析与改进[J];硅谷;2011年24期

8 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期

9 焦鹏;唐见兵;查亚兵;;仿真可信度评估中相似度方法的改进及其应用[J];系统仿真学报;2007年12期

10 姜毅;乐庆玲;;一种基于兴趣相似度的学习社区算法[J];电脑知识与技术(学术交流);2007年16期

相关会议论文 前10条

1 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 陆劲挺;路强;刘晓平;;对比相似度计算方法及其在功能树扩展中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

5 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年

6 洪文学;王金甲;常凤香;宋佳霖;刘文远;王立强;;基于图形特征增强的相似度分类器的研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年

7 雷庆;吴扬扬;;一种基于语义信息计算XML文档相似度的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

8 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年

9 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年

10 王健;刘衍珩;焦玉;;VANETs信任传播建模[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

相关重要报纸文章 前1条

1 王伽 卫江;出入境证件照片应及时更换[N];中国国门时报;2008年

相关博士学位论文 前10条

1 操震洲;矢量数据动态多尺度网络传输研究[D];南京大学;2015年

2 程亮;基于本体的疾病数据整合与挖掘方法研究[D];哈尔滨工业大学;2014年

3 刘振宇;基于区域相似度和特征降维的极化SAR影像分类[D];武汉大学;2013年

4 曹,

本文编号:2560468


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2560468.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a984b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com