基于微博的主题社区发现
发布时间:2019-10-13 22:36
【摘要】:微博,作为一种新兴的互联网交流与分享平台,已经获得巨大数量用户的亲睐,Twitter、FaceBook、Sina、Tencent等微博网站已成为海量信息的发布体。微博平台中蕴含着大量有价值的信息有待挖掘。 在数据挖掘领域,尽管传统的基于文本、基于内容的挖掘分析方法已经得到了广泛的研究并取得了很大的成功。但对于微博文本的特殊性,每条文本信息短小、口语化且带有一些结构化社会网络方面的信息,传统的文本挖掘算法不能很好的对它进行建模。而由于海量用户及信息的存在,使微博的数据挖掘不能仅仅依靠用户关系的分析。 为了满足微博营销寻找投放目标的需求,本文综合考虑了面向微博文本内容及微博用户社会化链接关系,提出了一种微博主题社区的发现方法。文中创造性的结合了领袖发现、文本分类以及最大流社区发现的基于内容、链接关系的分析技术,同时采用多种剪枝策略,设计出了一个比较高效准确的微博主题爬虫。 实验经过真实数据的采集,并且从不同的维度对结果数据进行了实验分析。
【学位授予单位】:华东理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP393.092;TP311.13
本文编号:2548927
【学位授予单位】:华东理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP393.092;TP311.13
【参考文献】
相关期刊论文 前10条
1 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
2 李林容;黎薇;;微博的文化特性及传播价值[J];当代传播;2011年01期
3 曾水香;罗林波;;基于改进Hits算法的多主题爬虫研究与实现[J];福建电脑;2010年05期
4 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期
5 金永生;王睿;陈祥兵;;企业微博营销效果和粉丝数量的短期互动模型[J];管理科学;2011年04期
6 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
7 周德懋;李舟军;;高性能网络爬虫:研究综述[J];计算机科学;2009年08期
8 张金增;范明;;一种改进的基于最大流的Web社区挖掘算法[J];计算机应用;2009年01期
9 皮靖;邵雄凯;肖雅夫;;基于朴素贝叶斯算法的主题爬虫的研究[J];计算机与数字工程;2012年06期
10 高琰;谷士文;唐t;;基于链接分析的Web社区发现技术的研究[J];计算机应用研究;2006年07期
,本文编号:2548927
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2548927.html