基于评论树的微博社区热门话题检测方法
本文关键词:基于评论树的微博社区热门话题检测方法
更多相关文章: 微博社区 热门话题 过滤 评论树 话题热度评价模型
【摘要】:首先在分析微博文本特点的基础上设计了一种垃圾微博的过滤算法;针对微博数据稀疏性这一问题,利用社区内部联系紧密的特性,提出了微博评论树的概念和一种话题热度评价模型。最后基于以上两点提出了一种微博社区热门话题检测方法。真实数据集上的实验表明了过滤的必要性和所提出的微博社区热门话题检测方法的有效性。
【作者单位】: 国家数字交换系统工程技术研究中心;铁道部信息技术中心;
【关键词】: 微博社区 热门话题 过滤 评论树 话题热度评价模型
【基金】:国家“863”计划资助项目(2011AA010603,2011AA010605)
【分类号】:TP393.092
【正文快照】: 0引言微博是一个基于用户关系的信息分享、传播以及获取的平台。自诞生之日起,微博凭借其简单灵活的组网方式和强大的信息传播能力迅速吸引了大量的用户。2013年1月,中国互联网络信息中心(CNNIC)发布的《第31次中国互联网络发展状况统计报告》[1]显示,截至2012年12月底,我国微
【参考文献】
中国期刊全文数据库 前5条
1 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
2 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
3 王琳;冯时;徐伟丽;杨卓;王大玲;张一飞;;一种面向微博客文本流的噪音判别与内容相似性双重检测的过滤方法[J];计算机应用与软件;2012年08期
4 闫光辉;舒昕;马志程;李祥;;基于主题和链接分析的微博社区发现算法[J];计算机应用研究;2013年07期
5 张欣;;中文Blog热门话题检测技术研究[J];软件导刊;2011年09期
【共引文献】
中国期刊全文数据库 前10条
1 税仪冬;瞿有利;黄厚宽;;周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J];北京交通大学学报;2009年05期
2 许志凯;徐志明;李栋;李生;;面向互联网新闻的话题检测与追踪[J];智能计算机与应用;2011年03期
3 陈学昌;韩佳珍;魏桂英;;话题识别与跟踪技术发展研究[J];中国管理信息化;2011年09期
4 丁荩;涂浩;;微博感知突发重大新闻事件的研究与分析[J];广西大学学报(自然科学版);2011年S1期
5 仲兆满;刘宗田;周文;付剑锋;;基于事件的文本相似度计算[J];广西师范大学学报(自然科学版);2009年01期
6 刘宇;;基于故事的新闻视频事件专题分析方法研究[J];中国传媒科技;2012年20期
7 孙乃利;王玉龙;沈奇威;;微博客意见领袖识别的研究[J];电信技术;2012年12期
8 仲兆满;刘宗田;李存华;;事件本体模型及事件类排序[J];北京大学学报(自然科学版);2013年02期
9 王君泽;马静;杜洪涛;;微博舆情分析平台的框架与支撑技术研究[J];电子政务;2013年01期
10 孙建旺;吕学强;郭嵡秀;;基于微博转发集的微博过滤研究[J];北京信息科技大学学报(自然科学版);2013年03期
中国重要会议论文全文数据库 前4条
1 张晓菲;张火明;高明正;;三种智能优化算法的研究进展[A];中国仪器仪表学会第十一届青年学术会议论文集[C];2009年
2 丁伟莉;赵华;郑德权;赵铁军;于浩;;中文Blog热门话题检测与排序技术研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 张阔;李涓子;吴刚;;基于关键词元的话题内事件检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 刘娜;肖智博;路莹;唐晓君;肖鹏;;自适应主题融合的多文档自动摘要算法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
中国博士学位论文全文数据库 前10条
1 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
2 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
3 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
4 王肃;基于多Agent的突发事件信息智能监测系统研究[D];北京邮电大学;2011年
5 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年
6 单建芳;面向事件的文本表示研究[D];上海大学;2012年
7 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
8 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
9 文军;新闻视频故事单元跟踪关键技术研究[D];国防科学技术大学;2008年
10 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 江涛;基于藏文web舆情分析的热点发现算法研究[D];西北民族大学;2010年
2 王允;网络舆情数据获取与话题分析技术研究[D];解放军信息工程大学;2010年
3 刘嵩;网络中文事件自动检测技术研究[D];解放军信息工程大学;2010年
4 和婷;面向机械产品设计领域中自然语言理解的动词聚类[D];西安电子科技大学;2011年
5 王伟;基于网络信息的热点事件发现与分析研究[D];华东师范大学;2011年
6 袁吕;基于话题检测与跟踪的话题搜索技术研究[D];哈尔滨工业大学;2010年
7 刘旭;博客热点话题挖掘方法[D];哈尔滨工业大学;2010年
8 韩兵;新闻视频故事单元关联分析技术研究[D];国防科学技术大学;2010年
9 李博;网络热点事件挖掘及特征描述研究[D];国防科学技术大学;2010年
10 殷风景;面向网络舆情监控的热点话题发现技术研究[D];国防科学技术大学;2010年
【二级参考文献】
中国期刊全文数据库 前6条
1 谷波,张永奎;文本聚类算法的分析与比较[J];电脑开发与应用;2003年11期
2 李晓黎,刘继敏,史忠植;基于支持向量机与无监督聚类相结合的中文网页分类器[J];计算机学报;2001年01期
3 乔秀全;杨春;李晓峰;陈俊亮;;社交网络服务中一种基于用户上下文的信任度计算方法[J];计算机学报;2011年12期
4 何镝;彭智勇;梅晓茸;;Web社区管理研究综述[J];计算机科学与探索;2011年02期
5 曹鹏;李静远;满彤;刘悦;程学旗;;Twitter中近似重复消息的判定方法研究[J];中文信息学报;2011年01期
6 杨小明;罗云;;ISODATA算法的实现与分析[J];采矿技术;2006年02期
【相似文献】
中国期刊全文数据库 前10条
1 董惠君;谈热门话题节目[J];视听界;1995年04期
2 N.K-D.;;报界热门话题[J];科技潮;1998年05期
3 杨旭东;热门话题的谈法分析──以“知识经济与高等教育”话题为例[J];现代传播-北京广播学院学报;1999年05期
4 王强;;构建企业完整的知识体系[J];中国计算机用户;2008年Z2期
5 阿昆;;企业重组话档案[之一][J];北京档案;2007年03期
6 金顺荣;谈思辨在热门话题中的运用[J];新闻前哨;1999年02期
7 许浚;公司治理与企业发展[J];通信企业管理;2005年12期
8 ;知识经济——当今热门话题(上)[J];电脑知识;1998年09期
9 张群;承诺什么[J];中国邮政;1997年07期
10 黄权才;谈图书馆界的热门话题——知识经济[J];图书馆界;1999年02期
中国重要会议论文全文数据库 前3条
1 胡万地;姚伟;;构建和谐企业之管见[A];落实科学发展观 构建和谐社会——第十一届浙江省经营管理大师风采及浙江省经营管理研究会2005年年会论文汇编[C];2005年
2 刘春林;马英姿;;思维向微观延伸苦练内功工作从基础入手建立现代企业制度[A];现代企业运行机制与思维创新——企业运行机制与思维创新研讨会议论文[C];2003年
3 张志敏;;西部大开发决不能以牺牲环境为代价[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
中国重要报纸全文数据库 前10条
1 沈莹;“家庭话题研讨”催生文明风尚[N];中国妇女报;2007年
2 本报记者 房琳琳 赵英淑;聚焦2006两会热门话题[N];科技日报;2006年
3 记者 毛丽萍;“全民创业”成武汉市政协全会热门话题[N];人民政协报;2008年
4 记者 莫瑞宁;稳定就业 共同担当责任[N];西安日报;2009年
5 记者 刘云山;消费账单成为热门话题[N];中国邮政报;2005年
6 秦玉龙;3.15 消费维权再度成为热门话题[N];平凉日报;2006年
7 记者 陈枫 雷辉;政府要关心民工的“被窝”[N];南方日报;2010年
8 记者 赵鹏 张建高;热门话题冷静思考[N];新华每日电讯;2002年
9 本报记者 白槐;津津乐道 热门话题[N];中国旅游报;2001年
10 ;IPv6、移动性和SIP成为热门话题[N];人民邮电;2006年
中国硕士学位论文全文数据库 前5条
1 李新娟;微博热门话题意义生成的符号学分析[D];西北师范大学;2012年
2 杨丹丹;论新浪微博热门话题的传播[D];东北师范大学;2012年
3 刘璐;面向微博热门话题的主客观分类方法研究[D];山西大学;2013年
4 张文汐;新浪微博热门话题的特点与规律研究[D];辽宁大学;2014年
5 王征勇;微博平台的热门话题检测[D];浙江大学;2013年
,本文编号:997185
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/997185.html