面向网络论坛的话题发现及其关注度变化趋势预测
发布时间:2021-12-02 16:21
随着互联网的发展,信息传播越来越普及,网络言论更加自由。网络论坛已经成为人们发表观点的重要平台。论坛管理人员需要利用有效的技术,对论坛的信息进行管理,能对海量、无序、分散的论坛数据进行有效的组织,可以对论坛中的热点话题进行发现,并且在此基础上能够有效追踪话题的发展动态,为相关部门及时了解话题发展动态并且采取相应的措施提供了必要的手段。本文在话题发现的基础上研究了对话题关注度变化趋势的预测。第一,本文将从网络论坛得到的主题信息用特征向量的形式进行表示,并利用聚类的方法对这些向量集合进行聚类得到话题簇,并对得到的话题簇进行过滤。第二,在得到的话题簇的基础上,对其包括的主题信息的历史数据进行分析,由话题的发展趋势特征,构建马尔可夫链,根据马尔可夫预测模型对其定性分析;第三,由于每个论坛的用户活跃时间都不同,话题在单个论坛的发展趋势有着共性,分析影响论坛中的话题发展趋势的因素,确定系统状态,构建马尔可夫过程,用强化学习来解决各个状态下的最优预测值,根据话题在论坛中所处的状态,定量的预测它在下一段时间内变化值。
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题来源及应用背景
1.2 课题研究的目的和意义
1.3 国内外研究现状
1.4 本文内容安排
2 基于文本聚类的热点话题发现
2.1 问题描述
2.2 论坛主题分析
2.3 论坛话题发现
2.4 算例分析
2.5 本章小结
3 基于马尔可夫模型的话题发展趋势预测
3.1 相关描述
3.2 长期话题发展趋势中的马尔可夫预测模型
3.3 算例分析
3.4 本章小结
4 强化学习应用于话题发展趋势的预测
4.1 问题描述
4.2 基于强化学习的预测
4.3 算例分析
4.4 本章小结
5 总结与展望
5.1 总结
5.2 展望
致谢
参考文献
附录 在攻读硕士期间发表的论文
【参考文献】:
期刊论文
[1]基于正负量化的DCT域数字图像盲水印算法研究[J]. 李昊,吕建平,杨芳芳. 计算机工程与应用. 2011(05)
[2]面向异质关系的社区挖掘[J]. 王金龙,徐从富,骆国靖. 计算机应用. 2007(12)
[3]马尔可夫链模型及其应用研究[J]. 陈建华. 科技资讯. 2007(14)
[4]BBS数据挖掘研究[J]. 吴刚,辛毅,赵煦. 中国教育网络. 2007(05)
[5]BBS中主题发现原型系统的设计与实现[J]. 蒋凡,高俊波,张敏,王煦法. 计算机工程与应用. 2005(31)
[6]强化学习理论、算法及应用[J]. 张汝波,顾国昌,刘照德,王醒策. 控制理论与应用. 2000(05)
[7]社会热点成因分析[J]. 熊家余. 新闻前哨. 2000(04)
[8]面向动态演化的话题检测研究[J]. 赵华,赵铁军,于浩,张姝. 高技术通讯. 2006 (12)
[9]初始化类中心的增量K均值法及其在新闻事件探测中的应用[J]. 雷震,吴玲达,雷蕾,黄炎焱. 情报学报. 2006 (03)
博士论文
[1]数据挖掘中聚类若干问题研究[D]. 赵恒.西安电子科技大学 2005
[2]聚类分析中若干关键技术的研究[D]. 杨小兵.浙江大学 2005
硕士论文
[1]面向论坛的话题发现、跟踪及传播技术研究[D]. 赵慧杰.哈尔滨工程大学 2010
[2]基于论坛数据源的QA技术的研究与实现[D]. 罗斌.北京交通大学 2007
[3]马尔可夫链预测方法及其应用研究[D]. 张宗国.河海大学 2005
本文编号:3528777
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题来源及应用背景
1.2 课题研究的目的和意义
1.3 国内外研究现状
1.4 本文内容安排
2 基于文本聚类的热点话题发现
2.1 问题描述
2.2 论坛主题分析
2.3 论坛话题发现
2.4 算例分析
2.5 本章小结
3 基于马尔可夫模型的话题发展趋势预测
3.1 相关描述
3.2 长期话题发展趋势中的马尔可夫预测模型
3.3 算例分析
3.4 本章小结
4 强化学习应用于话题发展趋势的预测
4.1 问题描述
4.2 基于强化学习的预测
4.3 算例分析
4.4 本章小结
5 总结与展望
5.1 总结
5.2 展望
致谢
参考文献
附录 在攻读硕士期间发表的论文
【参考文献】:
期刊论文
[1]基于正负量化的DCT域数字图像盲水印算法研究[J]. 李昊,吕建平,杨芳芳. 计算机工程与应用. 2011(05)
[2]面向异质关系的社区挖掘[J]. 王金龙,徐从富,骆国靖. 计算机应用. 2007(12)
[3]马尔可夫链模型及其应用研究[J]. 陈建华. 科技资讯. 2007(14)
[4]BBS数据挖掘研究[J]. 吴刚,辛毅,赵煦. 中国教育网络. 2007(05)
[5]BBS中主题发现原型系统的设计与实现[J]. 蒋凡,高俊波,张敏,王煦法. 计算机工程与应用. 2005(31)
[6]强化学习理论、算法及应用[J]. 张汝波,顾国昌,刘照德,王醒策. 控制理论与应用. 2000(05)
[7]社会热点成因分析[J]. 熊家余. 新闻前哨. 2000(04)
[8]面向动态演化的话题检测研究[J]. 赵华,赵铁军,于浩,张姝. 高技术通讯. 2006 (12)
[9]初始化类中心的增量K均值法及其在新闻事件探测中的应用[J]. 雷震,吴玲达,雷蕾,黄炎焱. 情报学报. 2006 (03)
博士论文
[1]数据挖掘中聚类若干问题研究[D]. 赵恒.西安电子科技大学 2005
[2]聚类分析中若干关键技术的研究[D]. 杨小兵.浙江大学 2005
硕士论文
[1]面向论坛的话题发现、跟踪及传播技术研究[D]. 赵慧杰.哈尔滨工程大学 2010
[2]基于论坛数据源的QA技术的研究与实现[D]. 罗斌.北京交通大学 2007
[3]马尔可夫链预测方法及其应用研究[D]. 张宗国.河海大学 2005
本文编号:3528777
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3528777.html