基于传播价值的微博突发话题检测系统设计与实现
本文选题:微博 + 信息采集 ; 参考:《山东师范大学》2017年硕士论文
【摘要】:信息技术日益发展,web2.0时代也随之到来,自媒体平台也已慢慢地融进各个网民的生活中,新浪微博是典型的例子。自媒体兴起,带给了用户新体验,用户可以借助手机、QQ、微信、邮箱、网页等传播渠道发表文字信息及图片甚至是影音等多媒体信息,分享个人最新动态,把身边的实时信息与大家分享。正是这个原因,在微博中,用户有新的功能,制造信息和传播信息。信息发布、转发,既快又方便,于是微博在信息传播速率方面占有领先的位置。在微博平台上,社会上出现的突发性话题传播方式是利用微博用户间的关注关系转发。这种传播方式很容易将范围扩大到传统的媒体,最常见的传统媒体就是新闻,随之在社会上造成巨大影响。因此,基于微博的突发话题检测技术,会为及时发现社会热点、尽快感知网络民意、及早响应突发事件等方面带来积极的现实意义。基于此,本文会设计并实现一个基于传播价值的微博突发话题检测系统,主要工作涉及以下三个方面:(1)在论文的准备阶段,主要是阅读大量的文献和相关资料并对到目前为止的微博突发话题检测研究现状进行了初步了解,在掌握突发话题检测的研究背景及意义的基础上,确定了系统的需求分析,制定了系统需要实现的三个功能:信息采集、数据处理、突发话题检测。与此同时,介绍系统的功能性与非功能性需求,约束了系统开发环境。(2)本文在分析话题检测整个工作流程的基础上,考虑新浪微博具有的短文本、实时、社交性、媒体性等多个特点,保证突发词的两个特性的同时还要体现突发词的区分度,于是定义和引入了微博的传播价值,它的计算过程包含两个方面,用户影响力和微博的显著度。本文设计了基于传播价值的微博突发话题检测的算法,第一步,依照词语在时间上的变化确定候选突发词集合,第二步利用权重计算和传播价值计算结合的方式完成突发词的筛选。最后利用词共现的概率计算突发词间相似度,利用single-pass的聚类算法完成突发话题检测。(3)在系统需求分析的基础上,设计了基于传播价值的突发话题检测系统的工作流程。在系统总体架构上,分别分析两种模式C/S和B/S,B/S开发模式更适合本系统的设计;在设计系统层次方面,遵循高内聚、低耦合的原则,系统运用三层体系架构:数据访问层(DAL)、业务逻辑层(BLL)、表示层(UI);此外,系统对数据库的选择是Microsoft SQL Server 2008版本,开发语言为C#。
[Abstract]:With the development of information technology and the arrival of Web 2.0 era, Sina Weibo is a typical example. Since the media platform has been gradually integrated into the lives of all Internet users, Sina Weibo is a typical example. Since the rise of the media, it has brought users a new experience. Users can use their mobile phones, QQQs, WeChat, mailboxes, web pages and other channels to publish text information, pictures and even multimedia information, such as video and audio, to share their latest developments. Share the real-time information around you. It is for this reason that in Weibo, users have new capabilities to produce and disseminate information. Information distribution, forwarding, both fast and convenient, so Weibo in the speed of information transmission occupies a leading position. On the Weibo platform, the sudden topic communication is transmitted by using the attention relation between Weibo users. It is easy to extend its scope to traditional media, the most common of which is news, which has a great impact on society. Therefore, the technology of burst topic detection based on Weibo will bring positive practical significance for discovering social hot spots, perceiving network public opinion as soon as possible, and responding to unexpected events as soon as possible. Based on this, this paper will design and implement a Weibo burst topic detection system based on propagation value. The main work involves the following three aspects: 1) in the preparation phase of the thesis. It mainly reads a lot of literature and related materials and makes a preliminary understanding of the current research situation of Weibo burst topic detection so far. On the basis of mastering the background and significance of the research on burst topic detection, it determines the requirement analysis of the system. Three functions of the system are developed: information collection, data processing and burst topic detection. At the same time, it introduces the functional and non-functional requirements of the system, which constrains the system development environment. Media and other characteristics ensure that the burst word features at the same time to reflect the classification of burst words, so the definition and introduction of Weibo transmission value, its calculation process includes two aspects, user influence and Weibo saliency. This paper designs a Weibo burst topic detection algorithm based on propagation value. The first step is to determine the candidate burst word set according to the temporal change of words. The second step uses the combination of weight calculation and propagation value calculation to select burst words. Finally, the probabilities of co-occurrence are used to calculate the similarity between burst words, and the clustering algorithm of single-pass is used to complete burst topic detection. On the basis of system requirement analysis, the workflow of burst topic detection system based on propagation value is designed. In the overall architecture of the system, the two development modes, C / S and B / S / S, respectively, are more suitable for the design of the system, and follow the principles of high cohesion and low coupling in the design system level. The system uses three layers of architecture: data access layer (DAL), business logic layer (BLL), presentation layer (UI); in addition, the database is selected as Microsoft SQL Server 2008 version, and the development language is C#.
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.092;TP311.52
【相似文献】
相关期刊论文 前10条
1 张文睿;;莫让抒情成蛇足[J];新闻与写作;2008年04期
2 钱耀敏;;媒体传播价值的审视与伦理抉择[J];中国广播;2010年11期
3 邱天君;;从传播价值看新闻的写作[J];郧阳师范高等专科学校学报;2006年04期
4 邱天君;;从传播价值看新闻的写作[J];宿州教育学院学报;2006年06期
5 何光辉;;《天气·资讯》在“虎豹”营销中的广告传播价值[J];广告人;2007年02期
6 张晶辉;;卫视的覆盖传播价值新解[J];市场观察;2007年06期
7 贺娅琳;;网络广告的传播价值:矛盾与对策[J];新闻界;2007年04期
8 程坤;;凤凰新媒体 探寻意义 传播价值[J];市场观察;2009年05期
9 刘会召;;公交电视的传播价值与发展趋势[J];传媒;2011年02期
10 寇紫遐;;网络社区的营销传播价值探析[J];新闻知识;2012年06期
相关会议论文 前4条
1 蒋家珍;钟秉枢;;体育赛事品牌传播价值评估系统的设计、验证与应用[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年
2 宋乐永;;论互联网环境下的新闻传播价值链[A];第十一届中国科协年会第33分会场新媒体与科技传播研讨会论文集[C];2009年
3 欧阳正德;王健;;浅析新媒体的传播价值[A];节能环保 和谐发展——2007中国科协年会论文集(二)[C];2007年
4 蒋家珍;钟秉枢;;体育赛事品牌传播价值评估系统的指标研究与系统设计[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年
相关重要报纸文章 前6条
1 徐基松;联手铸造安徽最具传播价值平台[N];安庆日报;2009年
2 赵 正;卫视的覆盖范围与传播价值[N];中国工商报;2005年
3 本报记者 王浩;找到有价值媒体是广告成功投放的关键[N];中国工商报;2012年
4 邓超义;网络营销切莫到处撒网[N];经济参考报;2009年
5 邓超义;网络营销切莫到处撒网[N];国际商报;2009年
6 特派记者 张琳;长春亚冬会组委会在京举行新闻发布会[N];长春日报;2005年
相关硕士学位论文 前10条
1 阳众;政务微博的政治传播价值研究[D];湘潭大学;2015年
2 张军;CCTV原创栏目《运动大不同》传播价值研究[D];北京体育大学;2016年
3 张珊;基于传播价值的微博突发话题检测系统设计与实现[D];山东师范大学;2017年
4 敬璐;信息传播价值与信息传播选择[D];新疆大学;2008年
5 徐培卿;“媒体博客”的传播价值及其应用方法研究[D];辽宁大学;2011年
6 刘媛媛;新媒体视野中的博客传播特性以及传播价值探析[D];西南政法大学;2011年
7 王敏;互联网广告媒体的经济传播价值[D];河南大学;2009年
8 安珂;新媒体视觉报道的传播特性和传播价值[D];吉林大学;2011年
9 崔敏;新安江“江雾”旅游传播价值的挖掘和构建[D];浙江大学;2014年
10 杨慧美;博客商业化及其发展前景探讨[D];山东大学;2007年
,本文编号:1904586
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1904586.html