基于微信公众号的领域智库的构建与应用
发布时间:2023-08-10 21:04
随着互联网信息资源的指数增长,人们从信息资源匮乏的时代来到了信息资源极其丰富的信息化时代。面对海量的信息资源,人们很难迅速地从中获取到真正想要的信息。因此,如何构建一个信息整合的智库,为用户提供更有价值的信息资源逐渐成为研究热点。为了改善互联网上信息资源杂乱无章的现象,方便用户更准确地获取所需要的信息,文本将微信公众号这一互联网信息入口级应用作为研究对象,对微信公众号的排序以及对微信文章的分类方法展开研究,提出了一种基于LambdaMART的微信公众号排序以及面向信息服务的微信文章分类方法。本文通过调研已有的微信公众号排序方法,并结合微信公众号的特点,提出了一种基于LambdaMART算法的微信公众号排序的方法。现有的公众号排序方法大多是根据总阅读数、总点赞数等量化指标通过人工经验赋权得到排序结果,忽略了文章内容对公众号选择的影响。为了解决该问题,在保留量化指标的基础上,本文提出了四个基于微信篇章内容的排序特征:主题垂直性、发文稳定性、主题覆盖率和主题相关性,使用LambdaMART算法针对上述特征集合训练模型,并通过主成分分析进行特征选择优化。然后,本文提出了一种基于文本体裁的面向信...
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与意义
1.2 本文主要工作
1.3 论文组织结构
第2章 相关研究
2.1 微信公众号评价指标及方法
2.2 排序学习
2.3 文本分类
2.3.1 特征工程
2.3.2 分类器
2.4 信息服务
2.5 本章小结
第3章 基于LambdaMART算法的微信公众号排序
3.1 LambdaMART算法
3.2 特征定义
3.2.1 主题垂直性
3.2.2 发文稳定性
3.2.3 主题覆盖率
3.2.4 主题相关性
3.3 相关性判别
3.4 实验设计与结果分析
3.4.1 实验语料
3.4.2 主成分分析
3.4.3 评价指标
3.4.4 实验结果和分析
3.5 本章小结
第4章 面向信息服务的微信文章分类
4.1 面向信息服务的微信文章分类
4.2 微信自动分类的特征选定
4.2.1 符号特征
4.2.2 词汇特征
4.2.3 词性特征
4.2.4 格式特征
4.2.5 浅层特征
4.3 微信文章分类实验
4.4 微信文章分类结果分析
4.5 本章小结
第5章 系统设计实现与应用
5.1 系统数据和环境
5.2 基于微信公众号的领域智库的应用
5.3 系统功能
5.4 本章小结
结论
参考文献
致谢
攻读硕士期间发表(含录用)的学术论文
本文编号:3841213
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与意义
1.2 本文主要工作
1.3 论文组织结构
第2章 相关研究
2.1 微信公众号评价指标及方法
2.2 排序学习
2.3 文本分类
2.3.1 特征工程
2.3.2 分类器
2.4 信息服务
2.5 本章小结
第3章 基于LambdaMART算法的微信公众号排序
3.1 LambdaMART算法
3.2 特征定义
3.2.1 主题垂直性
3.2.2 发文稳定性
3.2.3 主题覆盖率
3.2.4 主题相关性
3.3 相关性判别
3.4 实验设计与结果分析
3.4.1 实验语料
3.4.2 主成分分析
3.4.3 评价指标
3.4.4 实验结果和分析
3.5 本章小结
第4章 面向信息服务的微信文章分类
4.1 面向信息服务的微信文章分类
4.2 微信自动分类的特征选定
4.2.1 符号特征
4.2.2 词汇特征
4.2.3 词性特征
4.2.4 格式特征
4.2.5 浅层特征
4.3 微信文章分类实验
4.4 微信文章分类结果分析
4.5 本章小结
第5章 系统设计实现与应用
5.1 系统数据和环境
5.2 基于微信公众号的领域智库的应用
5.3 系统功能
5.4 本章小结
结论
参考文献
致谢
攻读硕士期间发表(含录用)的学术论文
本文编号:3841213
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3841213.html