网络论坛话题补全与热度量化研究
发布时间:2022-01-07 11:46
网络论坛中存在很多话题,通过这些话题可以了解当前社会的舆情,并可以对其进行监控,实施积极引导。对于相应的舆情监控系统,主要研究内容包括话题识别和话题监控。话题识别是对网络文本集进行处理,发现其中包含的话题类别,将文本集中的文本归入相应的类别。话题监控是对相关话题进行监测,并进行跟踪和控制。在网络话题识别方面,现有的研究中最重要、最基本的技术是文本分类和文本聚类。对于给定的一个话题,如果用分类或聚类的方法在文档集中得到相应的文本集合,无论是训练样本的学习还是聚类个数的给定,或者是决定类别粒度的阈值选取,在网络论坛的特殊情况下,其结果可能不能够很准确、全面地描述该话题。基于这些情况,文本提出了面向网络论坛的话题补全问题,并且实现了一种基于关键字的话题补全方法,使得用户可以根据给定的与某个话题相关的关键字对该话题进行较为全面的关键字补充。在话题热度计算方面,现有的研究都是对访问量、回复量、点击量等数据进行加权处理来计算相关话题的热度,这种方式下,权重的选取对最后的话题量化结果影响很大,对同样的话题、同样的数据取不同的权重计算出的热度数值会呈现出颠覆性的变化。本文根据这些情况提出基于用户活跃程...
【文章来源】:南京财经大学江苏省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
网络话题示例
HTML文档示例
帖子HTML结构图
【参考文献】:
期刊论文
[1]基于情感分布的微博热点事件发现[J]. 杨亮,林原,林鸿飞. 中文信息学报. 2012(01)
[2]面向互联网新闻的话题检测与追踪[J]. 许志凯,徐志明,李栋,李生. 智能计算机与应用. 2011(03)
[3]基于BBS的热点问题发现[J]. 梅泽勇,王清飞. 情报探索. 2011(03)
[4]基于核的自适应K-Medoid聚类[J]. 孙胜,王元珍. 计算机工程与设计. 2009(03)
[5]网络热点事件发现系统的设计[J]. 刘星星,何婷婷,龚海军,陈龙. 中文信息学报. 2008(06)
[6]话题检测与跟踪的评测及研究综述[J]. 洪宇,张宇,刘挺,李生. 中文信息学报. 2007(06)
[7]改进的k-平均聚类算法研究[J]. 孙士保,秦克云. 计算机工程. 2007(13)
[8]Design and Implementation of On-Line Hot Topic Discovery Model[J]. YE Hui-min~ 1,2 , CHENG Wei~2 DAI Guan-zhong~ 1 1. School of Automatic Control, Northwestern Polytechnical University, Xi’an 710072, Shaanxi, China; 2. Institute of Artificial Intelligence, Beijing City University , Beijing 100083, China. Wuhan University Journal of Natural Sciences. 2006(01)
[9]中文信息处理中自动分词技术的研究与展望[J]. 刘迁,贾惠波. 计算机工程与应用. 2006(03)
[10]基于模式聚合和决策树的文本分类规则抽取[J]. 王煜,王正欧. 情报科学. 2006(01)
硕士论文
[1]海量web舆情挖掘算法研究[D]. 周民.电子科技大学 2011
[2]微博客热点话题发现策略研究[D]. 杨冠超.浙江大学 2011
[3]网络热点新闻事件挖掘和跟踪分析方法的研究与实现[D]. 刘林浩.中南大学 2010
[4]基于聚类分析的网络论坛舆情信息挖掘技术研究[D]. 徐东亮.哈尔滨工业大学 2010
[5]网络舆情热点发现与事件跟踪技术研究[D]. 齐海凤.哈尔滨工程大学 2008
[6]基于XML的Web信息抽取技术的应用研究[D]. 陈佳.武汉理工大学 2007
本文编号:3574485
【文章来源】:南京财经大学江苏省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
网络话题示例
HTML文档示例
帖子HTML结构图
【参考文献】:
期刊论文
[1]基于情感分布的微博热点事件发现[J]. 杨亮,林原,林鸿飞. 中文信息学报. 2012(01)
[2]面向互联网新闻的话题检测与追踪[J]. 许志凯,徐志明,李栋,李生. 智能计算机与应用. 2011(03)
[3]基于BBS的热点问题发现[J]. 梅泽勇,王清飞. 情报探索. 2011(03)
[4]基于核的自适应K-Medoid聚类[J]. 孙胜,王元珍. 计算机工程与设计. 2009(03)
[5]网络热点事件发现系统的设计[J]. 刘星星,何婷婷,龚海军,陈龙. 中文信息学报. 2008(06)
[6]话题检测与跟踪的评测及研究综述[J]. 洪宇,张宇,刘挺,李生. 中文信息学报. 2007(06)
[7]改进的k-平均聚类算法研究[J]. 孙士保,秦克云. 计算机工程. 2007(13)
[8]Design and Implementation of On-Line Hot Topic Discovery Model[J]. YE Hui-min~ 1,2 , CHENG Wei~2 DAI Guan-zhong~ 1 1. School of Automatic Control, Northwestern Polytechnical University, Xi’an 710072, Shaanxi, China; 2. Institute of Artificial Intelligence, Beijing City University , Beijing 100083, China. Wuhan University Journal of Natural Sciences. 2006(01)
[9]中文信息处理中自动分词技术的研究与展望[J]. 刘迁,贾惠波. 计算机工程与应用. 2006(03)
[10]基于模式聚合和决策树的文本分类规则抽取[J]. 王煜,王正欧. 情报科学. 2006(01)
硕士论文
[1]海量web舆情挖掘算法研究[D]. 周民.电子科技大学 2011
[2]微博客热点话题发现策略研究[D]. 杨冠超.浙江大学 2011
[3]网络热点新闻事件挖掘和跟踪分析方法的研究与实现[D]. 刘林浩.中南大学 2010
[4]基于聚类分析的网络论坛舆情信息挖掘技术研究[D]. 徐东亮.哈尔滨工业大学 2010
[5]网络舆情热点发现与事件跟踪技术研究[D]. 齐海凤.哈尔滨工程大学 2008
[6]基于XML的Web信息抽取技术的应用研究[D]. 陈佳.武汉理工大学 2007
本文编号:3574485
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3574485.html