当前位置:主页 > 管理论文 > 移动网络论文 >

特征融合在微博数据挖掘中的应用研究

发布时间:2017-12-11 03:07

  本文关键词:特征融合在微博数据挖掘中的应用研究


  更多相关文章: 微博 聚类 融合数据


【摘要】:针对传统的微博聚类分析中,只单独针对微博阅读数、评论数等数据(下称微博结构化数据)进行分类或者单独针对由微博内容进行文本分词得到的分词数据(下称微博分词)进行分类的问题,本文采用了Kohonen聚类,研究结合微博结构化数据和微博分词的融合数据聚类的效果是否比单独对微博结构化数据或对微博分词聚类有所提高。实证数据实验结果显示,微博结构化数据单独聚类会出现一个类的标准差特别大(本文称为离群类),而对融合数据聚类,微博结构化数据则不会出现离群类;融合数据聚类结果对微博分词的影响不显著。
【作者单位】: 华南理工大学电子商务系;
【分类号】:TP311.13;TP393.092
【正文快照】: 微博是当今流行的信息发布和交流的工具,微博蕴含着大量的信息资源,成为数据分析的重要数据来源。微博数据可以分为两类,一类是结构化数据,微博的用户名、阅读数、转播数、发表日期等微博相关的信息(下称“微博结构化数据”);另一类是非结构化数据即微博用户发表微博内容的文

【参考文献】

中国期刊全文数据库 前5条

1 张国安;钟绍辉;;基于k均值聚类的微博用户分类的研究[J];电脑知识与技术;2012年26期

2 潘大庆;;基于层次聚类的微博敏感话题检测算法研究[J];广西民族大学学报(自然科学版);2012年04期

3 路荣;项亮;刘明荣;杨青;;基于隐主题分析和文本聚类的微博客中新闻话题的发现[J];模式识别与人工智能;2012年03期

4 马彬;洪宇;陆剑江;姚建民;朱巧明;;基于线索树双层聚类的微博话题检测[J];中文信息学报;2012年06期

5 熊祖涛;;基于稀疏特征的中文微博短文本聚类方法研究[J];软件导刊;2014年01期

【共引文献】

中国期刊全文数据库 前10条

1 潘大庆;;基于数据挖掘的舆情监测系统设计[J];大众科技;2014年11期

2 史剑虹;陈兴蜀;王文贤;;基于隐主题分析的中文微博话题发现[J];计算机应用研究;2014年03期

3 吴树芳;徐建民;孙晓磊;;基于贝叶斯信念网络的话题识别模型[J];计算机应用研究;2014年03期

4 孙国梓;黄斯琪;张禹森;陈国兰;;基于数据挖掘的微博话题检测方法研究进展[J];金陵科技学院学报;2014年01期

5 韩忠明;陈妮;张慧;杨伟杰;;一种非对称距离下的层次聚类算法[J];模式识别与人工智能;2014年05期

6 邱云飞;郭弥纶;邵良杉;;基于主题树的微博突发话题检测[J];计算机应用;2014年08期

7 刘业政;杜亚楠;姜元春;杜非;;基于热度曲线分类建模的微博热门话题预测[J];模式识别与人工智能;2015年01期

8 王连喜;;微博短文本预处理及学习研究综述[J];图书情报工作;2013年11期

9 杨尊琦;张倩楠;;基于k-means算法的微博用户推荐功能研究[J];情报杂志;2013年08期

10 林晓丽;胡可可;胡青;;基于Python的微博用户关系挖掘研究[J];情报杂志;2014年06期

中国博士学位论文全文数据库 前1条

1 王婵;基于Dirichlet过程混合模型的话题识别与追踪[D];北京邮电大学;2013年

中国硕士学位论文全文数据库 前10条

1 王政霄;基于微博的热点事件挖掘与情感分析[D];上海交通大学;2013年

2 张红卫;基于科技文献的时序主题链构建方法研究[D];大连理工大学;2013年

3 邱洋;微博数据提取及话题检测方法研究[D];大连理工大学;2013年

4 孙励;基于微博的热点话题发现[D];北京邮电大学;2013年

5 杨文漪;面向微博的事件检测算法研究[D];北京邮电大学;2013年

6 詹勇;基于主题模型和混合模型的微博客交叉话题发现研究[D];西南交通大学;2013年

7 张东霞;基于高校学生微博的网络热点发现及舆情分析研究[D];华南理工大学;2013年

8 王娟;基于本体的微博话题发现与倾向性分析研究[D];河南师范大学;2013年

9 张思龙;微博热点话题预判技术研究[D];解放军信息工程大学;2013年

10 张朕;基于多数据源的热点话题自动发现技术研究[D];山东师范大学;2014年

【二级参考文献】

中国期刊全文数据库 前10条

1 丁荩;涂浩;;微博感知突发重大新闻事件的研究与分析[J];广西大学学报(自然科学版);2011年S1期

2 李锋,周凯波,冯珊;基于统计特征的属性相似度计算模型[J];华中科技大学学报(自然科学版);2005年06期

3 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期

4 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期

5 程传鹏;夏敏捷;;微博自动标引关键技术的研究[J];计算机工程与应用;2011年34期

6 郑斐然;苗夺谦;张志飞;高灿;;一种中文微博新闻话题检测的方法[J];计算机科学;2012年01期

7 李锋;魏莹;;分布式环境下基于语义相似的案例检索[J];计算机工程;2007年09期

8 王永恒;贾焰;杨树强;;海量短语信息文本聚类技术研究[J];计算机工程;2007年14期

9 贾世杰;黄青松;马世霞;;基于网格聚类的案例检索策略[J];计算机工程;2009年10期

10 黄承慧;印鉴;侯f ;;一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J];计算机学报;2011年05期

中国博士学位论文全文数据库 前2条

1 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年

2 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年

【相似文献】

中国期刊全文数据库 前10条

1 李自平,徐蓉芬,陈芝萍;结构化数据获取与处理系统[J];核电子学与探测技术;1988年01期

2 苏祖辉;;一种结构化数据交换格式及方法[J];中小企业管理与科技(上旬刊);2012年07期

3 刘大滏;赵盛;;非结构化数据的ETL设计方法探讨[J];科技创新与应用;2014年14期

4 文必龙;王瑞;姚建蓬;黄俊莲;;一种Excel数据到结构化数据的转换方法[J];佳木斯大学学报(自然科学版);2006年03期

5 金更达;潘燕军;;结构化数据长期保存问题探析[J];档案学通讯;2006年05期

6 周进刚;邢铁军;纪勇;赵大哲;;一种结构化数据缓存方法[J];计算机工程;2010年20期

7 戴弘宁,文贵华,丁月华,范崇贵;非结构化数据的可视化编辑系统[J];计算机应用研究;2003年06期

8 李爱民;谭献海;;基于XML技术的非结构化数据到结构化数据转换的研究[J];铁路计算机应用;2012年10期

9 曹金山;张泽滨;;非结构化数据的ETL设计[J];现代电子技术;2011年10期

10 潘顺,金远平,欧阳晔;结构化数据到XML数据的语义映射[J];东南大学学报(自然科学版);2002年03期

中国重要会议论文全文数据库 前4条

1 陶晓鹏;胡运发;周水庚;王宁;;面向功能集成的结构化数据采掘语言[A];第十五届全国数据库学术会议论文集[C];1998年

2 金更达;潘燕军;;结构化数据长期保存问题探析[A];2007年浙江省高等学校档案优秀论文集[C];2007年

3 黄正行;吕旭东;段会龙;李昊e,

本文编号:1276910


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1276910.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户abac7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com