当前位置:主页 > 管理论文 > 移动网络论文 >

基于链接和萤火虫算法聚类博文发现热点话题

发布时间:2017-11-03 03:21

  本文关键词:基于链接和萤火虫算法聚类博文发现热点话题


  更多相关文章: 网络舆情 博客话题 热点发现 链接 萤火虫算法 聚类 簇结构


【摘要】:针对已有的基于链接分析的热点发现方法存在准确度较低、易受作弊链接影响、易产生主题漂移现象等问题,利用复杂网络簇结构具有高度主题相关的特点,提出一种融合应用链接分析和萤火虫算法聚类博文的热点话题发现算法。以博文页面为节点,与博文内容相同或相关的链接作为边,根据博文及博主的相关属性,综合评定页面权重,建立博客话题模型;运用萤火虫算法对博文进行聚类获得聚类中心,按页面权重将聚类中心从大到小排序,形成热点话题热度排行。实验结果表明,该方法能够发现精度更高、数量更多的博客热点话题。
【作者单位】: 广西大学计算机与电子信息学院;
【关键词】网络舆情 博客话题 热点发现 链接 萤火虫算法 聚类 簇结构
【基金】:广西科学研究与技术开发计划基金项目(桂科能114008-3B) 广西大学科研基金项目(XJZ130355) 广西研究生教育创新计划基金项目(YCSZ2014034)
【分类号】:TP393.092
【正文快照】: 0引言基于纯文本的热点话题发现方法未考虑网页文本的特殊性,获得的结果准确度不高[1-3],为此,研究者开始关注网页特征,在文本挖掘的基础上加入链接分析。文献[4]在内容计算网页相似度的基础之上,引入链接分析,提高了话题相关性度量的准确度;文献[5]通过页面链接来估计信息的

【参考文献】

中国期刊全文数据库 前8条

1 李东方;俞能海;尹华罡;;一种Web 2.0环境下互联网热点挖掘算法[J];电子与信息学报;2010年05期

2 郑魁;疏学明;袁宏永;;网络舆情热点信息自动发现方法[J];计算机工程;2010年03期

3 黄敏;胡学钢;;基于复杂网络方法的舆情热点挖掘[J];计算机仿真;2011年09期

4 杨博;刘大有;金弟;马海宾;;复杂网络聚类方法[J];软件学报;2009年01期

5 龙志yN;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期

6 王铁套;王国营;陈越;黄惠新;;基于语义模式与词汇情感倾向的舆情态势研究[J];计算机工程与设计;2012年01期

7 谢凤宏;张大为;黄丹;谢福鼎;;基于加权复杂网络的文本关键词提取[J];系统科学与数学;2010年11期

8 何建民;张义;;基于类熵距离测量的热点话题识别方法研究[J];情报科学;2012年08期

中国博士学位论文全文数据库 前1条

1 周而重;博客舆情热点发现与分析[D];北京工业大学;2013年

【共引文献】

中国期刊全文数据库 前10条

1 李东生;高明伦;;高密度集成与单芯片多核系统及其研究进展[J];半导体技术;2012年02期

2 武森;魏桂英;白尘;张桂琼;;分类属性高维数据基于集合差异度的聚类算法[J];北京科技大学学报;2010年08期

3 黄美璇;;基于主题发现的舆情分析系统的设计与实现[J];北京联合大学学报(自然科学版);2012年01期

4 赵金利;张群华;余贻鑫;贾宏杰;杨锦;;输电网网架结构的谱聚类分析算法[J];电力系统及其自动化学报;2009年04期

5 李翔;李仕强;赵青虎;;基于边聚类方法的复杂网络社团挖掘研究[J];电脑知识与技术;2012年10期

6 王娟;靳京;钱伟中;秦志光;;基于小波分解的群落流量异常检测[J];电子测量与仪器学报;2010年04期

7 金弟;刘大有;杨博;刘杰;何东晓;田野;;基于局部探测的快速复杂网络聚类算法[J];电子学报;2011年11期

8 王娟;秦志光;刘峤;钱伟中;;基于网络模块化结构的异常发现[J];电子与信息学报;2011年01期

9 刘旭;易东云;;基于保守合并策略的复杂网络社区结构发现[J];复杂系统与复杂性科学;2011年04期

10 董俊;任家东;卢海涛;;一种基于复杂网络属性值的K-means聚类算法[J];燕山大学学报;2012年04期

中国重要会议论文全文数据库 前1条

1 刘j;戴伟;李仕明;;基于多Agent的非常规突发事件在线信息预警策略研究[A];第十六届中国管理科学学术年会论文集[C];2014年

中国博士学位论文全文数据库 前10条

1 王娟;大规模网络安全态势感知关键技术研究[D];电子科技大学;2010年

2 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年

3 李伟;复杂网络特征结构的挖掘方法研究[D];南京理工大学;2010年

4 彭佳扬;代谢网络中功能模块挖掘和进化分析研究[D];中南大学;2011年

5 邓小龙;基于复杂网络分析的新一代电信CRM关键技术研究[D];北京邮电大学;2011年

6 叶祺;大规模网络的社团发现与多层次可视化分析[D];北京邮电大学;2011年

7 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年

8 窦炳琳;复杂网络中的动态过程问题研究[D];复旦大学;2011年

9 张长胜;求解规划、聚类和调度问题的混合粒子群算法研究[D];吉林大学;2009年

10 李向华;基于人工免疫系统的增量聚类算法及其优化与应用的研究[D];吉林大学;2009年

中国硕士学位论文全文数据库 前10条

1 周斌;复杂网络的社团结构挖掘及应用研究[D];广西师范学院;2010年

2 李亚杰;基于复杂网络理论的产业网络研究[D];浙江工商大学;2011年

3 王延鹏;复杂网络重叠社区发现算法研究[D];太原理工大学;2011年

4 张景阳;基于局部介数的复杂网络社区动态演化研究[D];太原理工大学;2011年

5 张博;高校网络突发事件应急处置系统的研究[D];北京交通大学;2011年

6 张冬威;基于网络聚类选择的神经网络集成方法及其在农业中的应用[D];吉林大学;2011年

7 张剑;复杂网络中的层次社团发现与应用[D];北京邮电大学;2011年

8 王俊;基于Web搜索的舆情分析系统的设计与实现[D];北京邮电大学;2011年

9 张翼;复杂网络节点重要性评估及其应用研究[D];华中师范大学;2011年

10 张华;面向应急决策的Web数据挖掘研究[D];兰州大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 熊文涛;齐欢;雍龙泉;;一种新的基于离差最大化的客观权重确定模型[J];系统工程;2010年05期

2 邱立坤;龙志yN;钟华;程葳;;层次化话题发现与跟踪方法及系统实现[J];广西师范大学学报(自然科学版);2007年02期

3 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期

4 任克强;赵光甫;张国萍;;基于带权语言网络的网页关键词抽取[J];计算机工程与应用;2008年08期

5 闻彬;何婷婷;罗乐;宋乐;王倩;;基于语义理解的文本情感分类方法研究[J];计算机科学;2010年06期

6 熊文新;宋柔;;信息检索用户查询语句的停用词过滤[J];计算机工程;2007年06期

7 张素智;刘放美;;基于矩阵约束法的中文分词研究[J];计算机工程;2007年15期

8 王晓斌;温春;石昭祥;;基于贝叶斯信息准则的文本主题数估计[J];计算机工程;2009年07期

9 程葳;龙志yN;;面向互联网新闻的在线话题检测算法[J];计算机工程;2009年18期

10 洪宇;张宇;范基礼;刘挺;李生;;基于子话题分治匹配的新事件检测[J];计算机学报;2008年04期

中国博士学位论文全文数据库 前10条

1 司夏萌;互联网信息传播结构下的舆论涌现过程研究[D];北京交通大学;2011年

2 朱天;社会网络中节点角色以及群体演化研究[D];北京邮电大学;2011年

3 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年

4 李澍淞;基于蜂拥策略的网络舆论演化模型研究[D];复旦大学;2011年

5 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年

6 余秀才;网络舆论传播的行为与动因[D];华中科技大学;2010年

7 张博;多视点商品本体学习研究[D];武汉理工大学;2010年

8 赵洁;基于粒计算的Web使用挖掘研究[D];华南理工大学;2010年

9 潘新;基于复杂网络的舆情传播模型研究[D];大连理工大学;2010年

10 梦非;社会化商务环境下意见领袖对购买意愿的影响研究[D];南京大学;2012年

【相似文献】

中国期刊全文数据库 前1条

1 张伟哲;张宏莉;张研;顾学迈;;基于簇结构的多中心网格资源监测系统[J];中国科技论文在线;2009年02期



本文编号:1134430

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1134430.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f9461***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com