热点特征深挖下的高效微博热门话题预测
本文关键词:热点特征深挖下的高效微博热门话题预测
【摘要】:提出一种基于数据挖掘的微博热门话题预测方法,在对微博词汇进行基于词频的热门分类基础上,通过热点发现、特征提取、发现学术领袖、热点追踪、关注学术领袖和热点分析6个阶段对预测进行分析和处理。通过统计的方法实现热门预测结果输出。采用一组网络词汇进行实际的热门预测仿真分析,结果显示,基于数据挖掘的微博热门话题预测方法能够更好的实现微博热门话题的预测,预测结果聚类特性优于传统预测方法,算法收敛特性好,具有很好的预测使用价值。
【作者单位】: 河南广播电视大学;
【基金】:2013河南省社科联资助项目(SKL-2013-598)
【分类号】:TP311.13;TP393.092
【正文快照】: 0引言数据挖掘技术是现代先进的数据深处理技术,它采用数据与数据之间、数据与文本之间的相互特征关系作为研究和识别对象,通过深层次的细微特征提取方法,将数据之间深层次的特征提取出来,作为下一步数据处理的输入因素。由于数据挖掘方法是一种先进的数据处理手段[1],所以在
【参考文献】
中国期刊全文数据库 前5条
1 李丹;;公民社会视角下中国微博舆情的发展与走向[J];东南传播;2011年05期
2 何黎;何跃;霍叶青;;微博用户特征分析和核心用户挖掘[J];情报理论与实践;2011年11期
3 欧健文,董守斌,蔡斌;模板化网页主题信息的提取方法[J];清华大学学报(自然科学版);2005年S1期
4 廉捷;周欣;曹伟;刘云;;新浪微博数据挖掘方案[J];清华大学学报(自然科学版);2011年10期
5 乔良;;文本挖掘技术研究及其在信息检索中的应用[J];软件导刊;2009年04期
【共引文献】
中国期刊全文数据库 前10条
1 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期
2 廉捷;刘云;;网络舆情中的信息预处理与自动摘要算法[J];北京交通大学学报;2010年05期
3 翟东升;杨洋;;基于XML技术的USPTO专利抽取系统[J];北京工业大学学报;2011年04期
4 冯少卿;都云程;;网页结构模板生成新方法研究[J];北京机械工业学院学报;2007年03期
5 翟菁;张莉钥;;谱写2011年社交媒体研究“五部曲”[J];今传媒;2012年07期
6 张志强;;基于分块频繁集抽取的Web文本关联分类[J];福建电脑;2011年11期
7 杨志伟;王鑫;;基于本体的气象领域聚焦爬虫[J];中国管理信息化;2011年04期
8 徐中华;;Web信息抽取方法概述[J];经营管理者;2008年09期
9 刘晨曦;吴扬扬;;一种基于块分析的网页去噪音方法[J];广西师范大学学报(自然科学版);2007年02期
10 李舒晨;刘云;李勇;;网络舆情分析中网页信息预处理方案的实现[J];电脑与电信;2008年10期
中国重要会议论文全文数据库 前3条
1 李连霞;马军;陈竹敏;;基于多特征的网页内容提取研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
2 时达明;林鸿飞;杨志豪;;基于网页框架和规则的网页噪音去除方法[A];第三届学生计算语言学研讨会论文集[C];2006年
3 冯少卿;都云程;施水才;;基于模板的网页主题信息抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前9条
1 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
2 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年
3 刘丹;大成组技术中的若干关键技术研究[D];浙江大学;2010年
4 张彦超;社交网络服务中信息传播模式与舆论演进过程研究[D];北京交通大学;2012年
5 黄石;转型期犯罪治理模式变迁研究[D];武汉大学;2013年
6 刘行军;微博用户及其信息传播影响因素研究[D];华中师范大学;2013年
7 万平;中国公众参与预算研究[D];南开大学;2013年
8 廉捷;基于用户特征的社交网络数据挖掘研究[D];北京交通大学;2014年
9 黄焕;面向e-Learning的学习者情感建模及应用研究[D];华中师范大学;2014年
中国硕士学位论文全文数据库 前10条
1 王乐超;Web环境下文献信息的提取与匹配研究[D];大连理工大学;2010年
2 李元乾;基于移动搜索用户关联的信息检索研究[D];北京交通大学;2010年
3 汪涵;金融投资数据仓库中数据融合的设计与实现[D];电子科技大学;2010年
4 李琼琼;网络文本自动分类器的设计与实现[D];电子科技大学;2010年
5 甄涛;基于社团发现的Blog信息收集原型系统的研究[D];解放军信息工程大学;2009年
6 刘继勇;网络舆情预警辅助决策支持系统模型及关键技术研究[D];石家庄经济学院;2010年
7 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年
8 王伟;搜索引擎智能化技术中若干关键问题的研究与实现[D];河北科技大学;2011年
9 戴支荣;基于Lucene的面向主题信息搜索系统的关键技术分析及应用[D];武汉理工大学;2011年
10 高永胜;基于树形结构的网页数据抽取模式研究及应用[D];大连理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期
2 刘婷;胡宝清;;基于聚类分析的复杂网络中的社团探测[J];复杂系统与复杂性科学;2007年01期
3 荆涛,左万利;基于可视布局信息的网页噪音去除算法[J];华南理工大学学报(自然科学版);2004年S1期
4 杨楠,弓丹志,李_,
本文编号:1228502
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1228502.html