面向文本语义分析应用的话题模型研究
发布时间:2021-04-30 22:48
随着互联网技术的迅猛发展和快速普及,人们在网络上的活动日益频繁,导致互联网数据爆炸式增长,特别是海量的非结构化文本和无标签的文本,包括电子邮件,社交媒体,新闻报道和电子商务等。如何有效地分析和处理海量的非结构化文本数据,迅速、精准地挖掘出有效的语义信息,成为文本智能处理研究领域所面临的巨大挑战之一。大量研究工作致力于使用无监督学习的方式,比如话题模型,对非结构化文本进行分析。然而,文本信息涉及的各个领域,具有不同的统计特征,同时,文本语义分析涵盖多种分析应用,各类应用的侧重点和目标也不尽相同。例如在舆情监测领域模型需要关注语义在时间上的演化,在社交媒体上的语义挖掘则着重处理短文本建模,而以用户作为出发点的应用如个性化推荐系统更重视基于用户兴趣点的细粒度分析,传统的话题模型难以满足各类分析任务,因此,为解决互联网海量文本数据带来的各类问题,不同的变种话题模型应运而生。本文在基于话题模型的文本语义分析的基础上,针对话题动态演化,短文本话题建模和基于用户兴趣点的有针对性挖掘这三个应用方面进行研究。具体研究内容如下:(1)在话题动态演化方面,本文提出了一种使用深度学习算法进行基于语义连接的话题...
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:117 页
【学位级别】:博士
【文章目录】:
致谢
摘要
abstract
第一章 绪论
1.1 研究背景
1.2 本文的主要工作和创新点
1.3 课题来源与本文组织结构
1.3.1 课题来源
1.3.2 本文组织结构
1.4 本章小结
第二章 基于话题模型的文本语义分析综述
2.1 传统话题模型
2.1.1 概率方法
2.1.2 矩阵分解方法
2.2 混合话题模型
2.2.1 动态话题模型
2.2.2 多维度话题模型
2.3 短文本话题模型
2.3.1 经典的短文本话题模型
2.3.2 基于外部辅助信息的短文本话题模型
2.4 话题模型的评测标准
2.4.1 话题可解释性评测
2.4.2 话题质量评测
第三章 基于语义连接的话题演化框架
3.1 引言
3.2 相关工作
3.2.1 话题演化
3.2.2 潜在的狄利克雷分配
3.2.3 深度学习算法Deep Walk
3.3 模型描述
3.3.1 事件与话题
3.3.2 演化的类型
3.3.3 语义连接
3.3.4 话题演化流程框架
3.4 实验结果
3.4.1 数据集
3.4.2 对比算法
3.4.3 事件演化和话题演化
3.4.4 新闻数据实验结果
3.4.5 邮件数据集的实验结果
3.4.6 Twitter数据集的实验结果
3.4.7 对比算法的实验结果
3.5 小结
第四章 结合分布式词嵌入表达的短文本话题模型
4.1 引言
4.2 相关工作
4.2.1 使用词嵌入技术的话题模型
4.2.2 基于注意力的话题模型
4.3 基于注意力分割的话题模型
4.3.1 模型描述和生成过程
4.3.2 算法
4.3.3 学习话题嵌入
4.4 实验结果
4.4.1 数据集描述和实验设置
4.4.2 话题一致性评估
4.4.3 短文本分类评估
4.4.4 片段分割实例展示
4.4.5 阈值讨论
4.5 小结
第五章 基于核心词对的有针对性话题模型
5.1 引言
5.2 相关工作
5.2.1 有针对性话题模型(Targeted Topic Models)
5.2.2 Biterm Topic Model
5.2.3 其他相关话题模型
5.3 模型描述
5.3.1 核心词对
5.3.2 模型描述和生成过程
5.3.3 公式推导
5.4 实验结果
5.4.1 对比算法与评估标准
5.4.2 数据集与实验设置
5.4.3 定量评估
5.4.4 时效性分析
5.4.5 定性评估
5.5 小结
第六章 结束语
6.1 主要研究工作总结
6.2 未来工作展望
参考文献
攻读博士学位期间的学术活动及成果情况
【参考文献】:
期刊论文
[1]一种基于LDA的在线主题演化挖掘模型[J]. 崔凯,周斌,贾焰,梁政. 计算机科学. 2010(11)
本文编号:3169628
【文章来源】:合肥工业大学安徽省 211工程院校 教育部直属院校
【文章页数】:117 页
【学位级别】:博士
【文章目录】:
致谢
摘要
abstract
第一章 绪论
1.1 研究背景
1.2 本文的主要工作和创新点
1.3 课题来源与本文组织结构
1.3.1 课题来源
1.3.2 本文组织结构
1.4 本章小结
第二章 基于话题模型的文本语义分析综述
2.1 传统话题模型
2.1.1 概率方法
2.1.2 矩阵分解方法
2.2 混合话题模型
2.2.1 动态话题模型
2.2.2 多维度话题模型
2.3 短文本话题模型
2.3.1 经典的短文本话题模型
2.3.2 基于外部辅助信息的短文本话题模型
2.4 话题模型的评测标准
2.4.1 话题可解释性评测
2.4.2 话题质量评测
第三章 基于语义连接的话题演化框架
3.1 引言
3.2 相关工作
3.2.1 话题演化
3.2.2 潜在的狄利克雷分配
3.2.3 深度学习算法Deep Walk
3.3 模型描述
3.3.1 事件与话题
3.3.2 演化的类型
3.3.3 语义连接
3.3.4 话题演化流程框架
3.4 实验结果
3.4.1 数据集
3.4.2 对比算法
3.4.3 事件演化和话题演化
3.4.4 新闻数据实验结果
3.4.5 邮件数据集的实验结果
3.4.6 Twitter数据集的实验结果
3.4.7 对比算法的实验结果
3.5 小结
第四章 结合分布式词嵌入表达的短文本话题模型
4.1 引言
4.2 相关工作
4.2.1 使用词嵌入技术的话题模型
4.2.2 基于注意力的话题模型
4.3 基于注意力分割的话题模型
4.3.1 模型描述和生成过程
4.3.2 算法
4.3.3 学习话题嵌入
4.4 实验结果
4.4.1 数据集描述和实验设置
4.4.2 话题一致性评估
4.4.3 短文本分类评估
4.4.4 片段分割实例展示
4.4.5 阈值讨论
4.5 小结
第五章 基于核心词对的有针对性话题模型
5.1 引言
5.2 相关工作
5.2.1 有针对性话题模型(Targeted Topic Models)
5.2.2 Biterm Topic Model
5.2.3 其他相关话题模型
5.3 模型描述
5.3.1 核心词对
5.3.2 模型描述和生成过程
5.3.3 公式推导
5.4 实验结果
5.4.1 对比算法与评估标准
5.4.2 数据集与实验设置
5.4.3 定量评估
5.4.4 时效性分析
5.4.5 定性评估
5.5 小结
第六章 结束语
6.1 主要研究工作总结
6.2 未来工作展望
参考文献
攻读博士学位期间的学术活动及成果情况
【参考文献】:
期刊论文
[1]一种基于LDA的在线主题演化挖掘模型[J]. 崔凯,周斌,贾焰,梁政. 计算机科学. 2010(11)
本文编号:3169628
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3169628.html
最近更新
教材专著