基于“特征降维”文本复杂网络的话题跟踪算法研究
发布时间:2023-03-07 18:01
随着移动互联网技术的不断迭代,移动互联网业务增长势头迅猛,其对人们的日常生活产生了巨大的影响。在移动社交领域,以微博、微信、今日头条为代表的应用程序,发挥着重要的连接作用,实现了人与人之间,人与信息之间的高效联动。精准的内容推送也是其增强用户对平台粘性的重要保障。在大数据背景下,如何快速精准的捕获到所关注的社会热点信息,成为网络舆情发展的核心问题。因此,话题跟踪技术应运而生,其旨在实现对以信息流形式呈现的新闻资讯中已知话题的动态跟踪,渗透在各类舆情分析系统之中。本文首先从当下实际问题出发,明确了课题的研究背景,解决的主要问题,进而明确了研究意义。然后对话题跟踪技术、文本复杂网络以及特征选择模型等基础理论进行深入研究与归纳总结,理清话题跟踪技术国内外当前的研究现状以及文本复杂网络处理网络话题文本语料时亟待解决的瓶颈问题。有针对性地提出了一种“特征降维”文本复杂网络的话题表示模型,解决了传统词同现文本复杂网络处理大规模语料库时的高维性和稀疏性问题,并提出了针对网络话题的自动进化算法,可以实现对热门话题下海量文本语义的高效精准表达。在基于文本复杂网络的话题跟踪算法研究中,综合考虑语义网络的结...
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 选题背景及研究意义
1.1.1 选题背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 文本复杂网络研究现状
1.2.2 特征选择模型研究现状
1.2.3 话题跟踪技术国内外研究现状
1.2.4 研究现状小结
1.3 研究内容及技术路线
1.3.1 研究内容
1.3.2 技术路线
1.4 主要工作及创新点
第二章 相关理论基础
2.1 复杂网络相关理论
2.1.1 复杂网络简介
2.1.2 常见的复杂网络模型
2.1.3 复杂网络基本性质
2.2 话题跟踪技术
2.2.1 话题跟踪技术研究框架
2.2.2 建立话题/报道模型
2.2.3 相似度计算方法
2.2.4 阈值比较
2.3 本章小结
第三章 “特征降维”文本复杂网络话题表示模型构建
3.1 语料特点分析
3.2 “特征降维”文本复杂网络模型自动生成算法设计
3.2.1 特征词条的提出
3.2.2 特征词条抽取与“特征降维”文本复杂网络生成
3.2.3 网络权重生成
3.3 文本复杂网络话题表示模型进化的算法设计
3.4 本章小结
第四章 基于“特征降维”文本复杂网络的话题跟踪算法设计
4.1 话题模型建立
4.2 报道模型建立
4.3 文本相似度算法设计
4.3.1 simhash算法原理简介
4.3.2 基于simhash算法的文本相似度计算
4.4 话题跟踪算法整体流程
4.5 本章小结
第五章 实验设计与结果分析
5.1 实验环境
5.2 实验数据
5.2.1 数据的获取
5.2.2 数据存储
5.2.3 数据预处理
5.3 基于“特征降维”文本复杂网络模型的话题特征发现实验
5.3.1 实验基本思路
5.3.2 微博话题模型的生成与进化
5.3.3 话题语义表达效果分析
5.4 “特征降维”文本复杂网络模型指导下的话题跟踪实验
5.4.1 实验基本思路
5.4.2 实验过程与重要参数设定
5.4.3 话题跟踪效果分析
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
在学期间的研究成果及发表的学术论文
本文编号:3757627
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 选题背景及研究意义
1.1.1 选题背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 文本复杂网络研究现状
1.2.2 特征选择模型研究现状
1.2.3 话题跟踪技术国内外研究现状
1.2.4 研究现状小结
1.3 研究内容及技术路线
1.3.1 研究内容
1.3.2 技术路线
1.4 主要工作及创新点
第二章 相关理论基础
2.1 复杂网络相关理论
2.1.1 复杂网络简介
2.1.2 常见的复杂网络模型
2.1.3 复杂网络基本性质
2.2 话题跟踪技术
2.2.1 话题跟踪技术研究框架
2.2.2 建立话题/报道模型
2.2.3 相似度计算方法
2.2.4 阈值比较
2.3 本章小结
第三章 “特征降维”文本复杂网络话题表示模型构建
3.1 语料特点分析
3.2 “特征降维”文本复杂网络模型自动生成算法设计
3.2.1 特征词条的提出
3.2.2 特征词条抽取与“特征降维”文本复杂网络生成
3.2.3 网络权重生成
3.3 文本复杂网络话题表示模型进化的算法设计
3.4 本章小结
第四章 基于“特征降维”文本复杂网络的话题跟踪算法设计
4.1 话题模型建立
4.2 报道模型建立
4.3 文本相似度算法设计
4.3.1 simhash算法原理简介
4.3.2 基于simhash算法的文本相似度计算
4.4 话题跟踪算法整体流程
4.5 本章小结
第五章 实验设计与结果分析
5.1 实验环境
5.2 实验数据
5.2.1 数据的获取
5.2.2 数据存储
5.2.3 数据预处理
5.3 基于“特征降维”文本复杂网络模型的话题特征发现实验
5.3.1 实验基本思路
5.3.2 微博话题模型的生成与进化
5.3.3 话题语义表达效果分析
5.4 “特征降维”文本复杂网络模型指导下的话题跟踪实验
5.4.1 实验基本思路
5.4.2 实验过程与重要参数设定
5.4.3 话题跟踪效果分析
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
在学期间的研究成果及发表的学术论文
本文编号:3757627
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3757627.html
最近更新
教材专著