视频分享网站热门视频快速挖掘预测模型
发布时间:2017-06-15 20:09
本文关键词:视频分享网站热门视频快速挖掘预测模型,由笔耕文化传播整理发布。
【摘要】:随着互联网的蓬勃发展,网络视频已经成为了互联网重要的产业之一。目前,互联网视频已经拥有了巨大用户数量规模,其形态多样和数据量大等特点使其传播影响力已经超越电视、纸媒等传统媒体。在Web2.0的发展契机下,互联网变得的更具有开放性、广泛性,其中视频分享网站以个人用户为网络视频主要的发布源头,使得节目内容最大化的丰富,视频数量也呈爆炸式的增长。视频分享网站类似优酷网,youtube等网站在视频网站加上了社交元素,使得视频分享网站能体现更丰富的内容元素,同时也为为实时热点、网络舆情等研究方向提供了更为丰富的元数据。热门视频能够为网站带来巨大流量,吸引更多用户观看,同时也能引发网友对视频内容发表评论,表达自己的观点。因此,如何在视频分享网站上快速发现潜在的热门视频资源,并跟踪监控视频热度变化,是一个亟需解决的问题。本文的研究重点是针对视频分享网站的特点,结合灰色Verhurlst预测模型,建立了一个热门视频挖掘预测的模型,能够快速发掘热门视频并预测视频的发展趋势。本文首先根据视频分享网站的粉丝社交特点,分析了视频分享网站对视频热度影响的几个因素,提出了账号质量、粉丝数量级别、话题热度是能够影响视频热度的因素,在热门视频的挖掘上,我们将账号质量、话题热度这两个因素作为参数加入到热度计算中,对比传统的热点视频发掘方法,缩短了热门视频发掘的时间,提高了热门视频发掘的效率。其次本文通过比较现有的趋势预测模型的优缺点,最终选择灰色Verhulst模型作为基础模型,在模型中加入了我们的话题热度参数,然后对比两种模型对视频热度进行预测,最终通过实验证明我们的改进模型提高了预测精度,降低了误差率。最后根据我们的理论模型研究设计了一个视频网站热点发掘和预测系统,对我们的模型进行综合实验,测试了模型性能。验证了我们的模型的可实现性、可靠性和高效性。
【关键词】:热门视频 视频网站 热点发掘 灰色理论 趋势预测
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.092;TP391.1
【目录】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 绪论11-15
- 1.1 研究背景和意义11-12
- 1.2 国内外研究现状及发展趋势12-13
- 1.3 本文的研究内容13
- 1.4 本文的组织13-15
- 第二章 相关理论知识15-22
- 2.1 热门视频的定义15
- 2.2 视频热度计算15-16
- 2.3 视频分享网站16-17
- 2.4 网络爬虫技术17
- 2.4.1 网络爬虫原理17
- 2.4.2 网页抓取策略17
- 2.5 话题检测与跟踪17-21
- 2.5.1 中文分词18
- 2.5.2 中文分词常见算法18-19
- 2.5.3 停用词19
- 2.5.4 向量空间模型19-20
- 2.5.5 特征选择20
- 2.5.6 文本相似性度量20-21
- 2.6 本章小结21-22
- 第三章 影响视频热度的因素22-35
- 3.1 数据来源22-23
- 3.2 账号粉丝数量与播放数量的关系23-31
- 3.2.1 视频类别范围的确定23-24
- 3.2.2 热度时间确定24-26
- 3.2.3 粉丝数量与总播放数量的关系26-29
- 3.2.4 优质帐号29-31
- 3.2.5 帐号质量库31
- 3.3 热门话题31-33
- 3.4 热门视频发掘33
- 3.5 实验33-34
- 3.5.1 实验内容33
- 3.5.2 实验结果33-34
- 3.6 本章小结34-35
- 第四章 热门视频预测与追踪35-52
- 4.1 视频资源热度的计算方法35-37
- 4.2 热度计算方法37-38
- 4.2.1 初始阶段37
- 4.2.2 跟踪预测阶段37-38
- 4.3 视频热度预测38-48
- 4.3.1 移动平均法38-39
- 4.3.2 指数平滑法39-41
- 4.3.3 ARIMA模型41
- 4.3.4 灰色理论41-43
- 4.3.5 灰色Verhuslt模型43-44
- 4.3.6 灰色Verhulst模型加入话题热度参数后的改进方法44
- 4.3.7 误差分析标准44-45
- 4.3.8 实验45-48
- 4.4 热度排序48-51
- 4.4.1 插入排序48-49
- 4.4.2 冒泡排序49
- 4.4.3 快速排序49
- 4.4.4 堆排序49-51
- 4.5 本章小结51-52
- 第五章 模型实现52-57
- 5.1 模型设计52
- 5.2 模块介绍52-55
- 5.2.1 数据采集模块52-54
- 5.2.2 话题计算54-55
- 5.2.3 热点发掘55
- 5.2.4 跟踪预测55
- 5.2.5 结果显示55
- 5.3 性能测验55-56
- 5.3.1 实验环境56
- 5.3.2 实验结果56
- 5.4 本章小结56-57
- 第六章 总结和展望57-58
- 致谢58-59
- 参考文献59-62
- 附录62-63
- 详细摘要63-65
【参考文献】
中国期刊全文数据库 前10条
1 董日壮;郭曙超;;网络爬虫的设计与实现[J];电脑知识与技术;2014年17期
2 罗小琴;;网络舆情监控在人口政策上的应用[J];中国信息安全;2014年06期
3 赵宇翔;范哲;朱庆华;;用户生成内容(UGC)概念解析及研究进展[J];中国图书馆学报;2012年05期
4 袁晓峰;;《知网》义原相似度计算的研究[J];辽宁大学学报(自然科学版);2011年04期
5 李宏波;;词典与统计相结合的中文分词算法研究[J];武汉理工大学学报(信息与管理工程版);2010年06期
6 杨凯峰;张毅坤;李燕;;基于文档频率的特征选择方法[J];计算机工程;2010年17期
7 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期
8 王正新;党耀国;刘思峰;;无偏灰色Verhulst模型及其应用[J];系统工程理论与实践;2009年10期
9 乔良;;文本挖掘技术研究及其在信息检索中的应用[J];软件导刊;2009年04期
10 熊德兰;程菊明;田胜利;;基于HowNet的句子褒贬倾向性研究[J];计算机工程与应用;2008年22期
本文关键词:视频分享网站热门视频快速挖掘预测模型,,由笔耕文化传播整理发布。
本文编号:453379
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/453379.html