面向微博热点话题发现的多标签传播聚类方法研究
本文关键词:面向微博热点话题发现的多标签传播聚类方法研究
更多相关文章: 微博 热点话题发现 老化理论 热词抽取 多标签传播
【摘要】:微博热点话题发现是目前的研究热点.针对传统热词抽取方法难以适用于微博数据的问题,提出一种基于老化理论的词生命值计算模型用于热词抽取,并基于热词间的相关性构建词共现网络;针对传统的词聚类算法不能较好地解决话题间存在重叠热词以及时间效率不佳的问题,引入多标签传播思想,设计一种接近线性时间复杂度的多标签传播聚类算法(TCMLPA)用于词共现网络的热词聚类,获得热点话题集.实验结果表明,词生命值计算模型能够有效过滤噪声并提取热词,TCMLPA算法则能够在保证聚类结果稳定性的情况下,有效提高热点话题发现的精度和效率.
【作者单位】: 福州大学
【关键词】: 微博 热点话题发现 老化理论 热词抽取 多标签传播
【基金】:国家自然科学基金项目(No.61103175) 福建省教育厅重点项目(No.JK2012003) 福建省科技创新平台项目(No.2009J1007) 福建省自然科学基金项目(No.2013J01232)资助
【分类号】:TP393.092;TP391.1
【正文快照】: 1引言微博现在已成为互联网交流的一种时尚,同时也是热点话题产生和讨论的重要场所.微博信息的指数增长使得如何有效地掌控海量信息并提取热点话题成为亟待解决的问题.热点话题是指在一段时间内,频繁出现在网络上的人们广泛关注并讨论的话题.最早在该领域开展研究的是由DARPA
【参考文献】
中国期刊全文数据库 前4条
1 曾依灵;许洪波;白硕;;网络文本主题词的提取与组织研究[J];中文信息学报;2008年03期
2 曹玉娟;牛振东;赵X;彭学平;;基于概念和语义网络的近似网页检测算法[J];软件学报;2011年08期
3 龙志yN;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期
4 周亚东;孙钦东;管晓宏;李卫;陶敬;;流量内容词语相关度的网络热点话题提取[J];西安交通大学学报;2007年10期
【共引文献】
中国期刊全文数据库 前10条
1 张召灵;张元林;;网络信息内容审计研究的现状及趋势[J];中国管理信息化;2010年22期
2 魏诗云;杨家骏;;网页近似重复检测算法研究[J];计算机光盘软件与应用;2012年08期
3 程們森;安俊秀;;基于特征词群的新闻类重复网页和近似网页识别算法[J];成都信息工程学院学报;2012年04期
4 李岩;娄云;;文本聚类算法在舆情监控中的应用分析[J];电子设计工程;2013年01期
5 潘大庆;;基于层次聚类的微博敏感话题检测算法研究[J];广西民族大学学报(自然科学版);2012年04期
6 袁胜;;基于LDA模型的科技文献话题演化分析[J];计算机光盘软件与应用;2014年21期
7 潘大庆;;基于数据挖掘的舆情监测系统设计[J];大众科技;2014年11期
8 陈婧;;基于语义网的软件工程数据查询处理技术[J];电子技术与软件工程;2015年04期
9 孙钦东;管晓宏;周亚东;;网络信息内容审计研究的现状及趋势[J];计算机研究与发展;2009年08期
10 庞海杰;;面向文本情感分析的商品评价信息检测[J];计算机应用;2012年07期
中国重要会议论文全文数据库 前3条
1 李恒训;张华平;秦鹏;于满泉;刘金刚;;基于主题词的网络热点话题发现[A];第五届全国信息检索学术会议论文集[C];2009年
2 许磊;张冬梅;;基于事件关联的舆情热度预测分析[A];虚拟运营与云计算——第十八届全国青年通信学术年会论文集(下册)[C];2013年
3 许磊;张冬梅;;基于事件关联的舆情热度预测分析[A];第十八届全国青年通信学术年会论文集(下册)[C];2013年
中国博士学位论文全文数据库 前10条
1 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
2 张博;多视点商品本体学习研究[D];武汉理工大学;2010年
3 向东;产品设计中多领域知识表达、获取及应用研究[D];华中科技大学;2012年
4 彭菲菲;网络热点话题发现的关键技术研究[D];中国矿业大学(北京);2012年
5 周而重;博客舆情热点发现与分析[D];北京工业大学;2013年
6 程文娟;基于文本挖掘的定向性信息分析研究[D];合肥工业大学;2012年
7 何东晓;复杂网络社团结构发现方法研究[D];吉林大学;2014年
8 任薇;基于微博的社会网络特征研究[D];西南大学;2014年
9 朱牧;复杂网络中社区发现关键技术研究[D];中国矿业大学;2014年
10 赵学华;统计网络模型若干关键问题研究[D];吉林大学;2014年
中国硕士学位论文全文数据库 前10条
1 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
2 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
3 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
4 李海林;网络舆情热点信息发现及其倾向性研究[D];武汉理工大学;2010年
5 李恒训;网络论坛采集及热点话题发现研究[D];首都师范大学;2011年
6 徐畅;我国网络舆论危机应急管理决策支持系统研究[D];华中师范大学;2011年
7 刘伟;基于数据挖掘的BBS用户评价系统研究[D];长春理工大学;2011年
8 王宏勇;网络舆情热点发现与分析研究[D];西南交通大学;2011年
9 王瑞雷;Web数据挖掘技术在网络教育论坛中的应用研究[D];新疆师范大学;2011年
10 张静;基于微博的网络热点发现模型及平台研究[D];华中科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邱立坤;龙志yN;钟华;程葳;;层次化话题发现与跟踪方法及系统实现[J];广西师范大学学报(自然科学版);2007年02期
2 王泽彬,金飞,李夏,王冠;Web数据挖掘技术及实现[J];哈尔滨工业大学学报;2005年10期
3 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
4 李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;2003年17期
5 程葳;龙志yN;;面向互联网新闻的在线话题检测算法[J];计算机工程;2009年18期
6 张晓艳;王挺;;话题发现与追踪技术研究[J];计算机科学与探索;2009年04期
7 吴平博,陈群秀,马亮;基于特征串的大规模中文网页快速去重算法研究[J];中文信息学报;2003年02期
8 刘远超;王晓龙;徐志明;关毅;;文档聚类综述[J];中文信息学报;2006年03期
9 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期
10 曾依灵;许洪波;白硕;;网络文本主题词的提取与组织研究[J];中文信息学报;2008年03期
中国硕士学位论文全文数据库 前2条
1 邹纲;中文新词语自动检测研究[D];中国科学院研究生院(计算技术研究所);2004年
2 周昭涛;文本聚类分析效果评价及文本表示研究[D];中国科学院研究生院(计算技术研究所);2005年
【相似文献】
中国期刊全文数据库 前10条
1 徐恩元;徐建华;;文献老化理论研究[J];四川图书馆学报;2006年06期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
,本文编号:619640
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/619640.html