当前位置:主页 > 管理论文 > 移动网络论文 >

基于隐含语义分析的微博热点话题发现策略

发布时间:2021-08-23 12:22
  作为一个社会化媒体,微博的应用已经深入到人们的日常生活中,成为大家发布和传播信息、获取知识的重要平台。文本是网络信息的主要载体,包含着网民的观点与思想倾向,对网络舆情分析和话题发现具有重大应用价值和研究意义。然而,社会化媒体上的大部分文本信息都属于短文本,短文本信息的不完整性、海量性和奇异性导致舆情分析和热点话题发现十分困难。本文首先分析了中文微博信息的特点,然后结合国内外话题发现的研究现状和相关技术,提出一个适用于中文微博的热点话题发现方法。论文主要做了以下几个方面的工作:(1)短文本固有的特征稀疏和样本类别分布不均衡等特点,使得计算普通文本特征权重的方法难以直接套用。为此,提出一种针对短文本的基于综合类频的特征权重算法。该算法引入反文档频和相关性频率的概念,综合考虑了样本在正类和负类中的分布情况。实验表明,相对于其他特征权重方法,该方法的微平均和宏平均值均在90%以上,能增强样本在负类中的类别区分能力,改善短文本分类的查准率和查全率。(2)采用隐含语义分析的方法对微博文本进行分析。传统向量空间模型通常基于特征词的匹配,但网络文本中存在大量的同义、多义词,导致文本相似度的评估结果不够... 

【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

基于隐含语义分析的微博热点话题发现策略


中国手机网民规模及其占网民比例Fig1.1ScaleofChina’sMobilePhoneUsersanditsProportioninCitizen

基于隐含语义分析的微博热点话题发现策略


用户关注的微博内容Fig1.2ContentofMicroblogUsersConcerned

基于隐含语义分析的微博热点话题发现策略


新浪微博首页Fig1.3HomeofSinaMicro-blog

【参考文献】:
期刊论文
[1]基于隐含语义分析的微博话题发现方法[J]. 马雯雯,魏文晗,邓一贵.  计算机工程与应用. 2014(01)
[2]微博突发话题检测方法研究[J]. 邱云飞,程亮.  计算机工程. 2012(09)
[3]一种中文微博新闻话题检测的方法[J]. 郑斐然,苗夺谦,张志飞,高灿.  计算机科学. 2012(01)
[4]基于机器学习的中文微博情感分类实证研究[J]. 刘志明,刘鲁.  计算机工程与应用. 2012(01)
[5]基于MB-LDA模型的微博主题挖掘[J]. 张晨逸,孙建伶,丁轶群.  计算机研究与发展. 2011(10)
[6]浅析微博中的“微舆情”[J]. 李心妍,刘俐俐.  新闻世界. 2011(07)
[7]基于划分和层次的混合动态聚类算法[J]. 郝洪星,朱玉全,陈耿,李米娜.  计算机应用研究. 2011(01)
[8]高性能网络爬虫:研究综述[J]. 周德懋,李舟军.  计算机科学. 2009(08)
[9]新的CDF文本分类特征提取方法[J]. 熊忠阳,蒋健,张玉芳.  计算机应用. 2009(07)
[10]面向短文本的动态组合分类算法[J]. 闫瑞,曹先彬,李凯.  电子学报. 2009(05)

硕士论文
[1]中文微博客热点话题检测与跟踪技术研究[D]. 孙胜平.北京交通大学 2011
[2]中文短文本分类的相关技术研究[D]. 崔争艳.河南大学 2011
[3]微博客热点话题发现策略研究[D]. 杨冠超.浙江大学 2011
[4]改进的K均值算法在中文文本聚类中的研究[D]. 李梅.安徽大学 2010
[5]网络舆情热点发现相关技术研究[D]. 秦宏宇.哈尔滨工程大学 2010
[6]基于向量空间模型的中文文本聚类方法的研究[D]. 姚清耘.上海交通大学 2008
[7]基于划分的聚类算法研究[D]. 郑柏杰.重庆大学 2005



本文编号:3357858

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3357858.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0dbd9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com