基于短文本处理算法优化的文本信息推荐系统的设计与实现
本文关键词:基于短文本处理算法优化的文本信息推荐系统的设计与实现 出处:《北京交通大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 短文本 特征词 K-means聚类算法 用户兴趣模型 文本推荐系统
【摘要】:"麦圈"作为推荐聚合类资讯产品,以"微博"用户行为数据包括发布、分享、转发等数据为基础,构建用户兴趣模型,并依赖于该模型向用户定向推荐资讯类内容。如何为用户精准的推荐信息成为了平台新的研究方向,因此,用户兴趣模型的构建是推荐系统中最重要的环节,而微博所蕴含的海量文本信息为个性化推荐提供了分析用户兴趣模型的信息数据源。然而由于微博文本数据长度较短,用户的兴趣多样化,系统推荐的效果不太理想,因此,对短文本处理算法的优化是提升系统推荐准确度和稳定性的关键点。本文设计的基于短文本的文本信息推荐系统,首先依据用户的微博行为数据构建用户兴趣模型,其次将待推荐的文本信息进行聚类分析,并与兴趣模型进行相似性计算,最后将结果推荐给用户浏览,同时将用户的评分数据反馈推荐系统,用于用户兴趣模型的更新优化。其中,向量空间模型是文本结构化表示、用户兴趣模型构建以及相似度计算的基础模型。本文的文本推荐系统基于短文本处理算法的优化以及用户兴趣模型的构建实现。首先针对微博短文本数据特点,在短文本预处理阶段,为了提升文本特征词的表征能力,在词项TF-IDF加权计算的基础上提出基于语义相关联的短文本特征词提取算法。然后,在短文本的聚类算法中,本文针对K-means算法对噪声敏感以及对初始中心选取存在依赖性问题,提出了将相似性度量作为初始中心计算的依据思路,并实现了基于相似中心的cK-means短文本聚类算法的设计方案,同时基于短文本算法的优化构建了用户兴趣模型。最后,本文将优化后的用户兴趣模型应用到具体的文本推荐系统中,给出了系统的整体框架,并详细叙述了推荐系统核心模块的实现细节以及系统测试分析。对短文本处理算优化的验证结果表明,本文提出的基于语义相关的文本特征词提取算法以及cK-means文本聚类算法准确度均有所提升,同时基于短文本处理算法优化的用户兴趣模型更适用于对短文本的兴趣聚合。对文本推荐系统的横向测试和纵向测试显示,基于短文本处理算法优化的用户兴趣模型应用到文本推荐系统之后,推荐系统的准确度和稳定性相比之前均有所提升。
[Abstract]:In this paper , based on the user ' s micro blog behavior data , this paper proposes a design scheme of user interest model based on the user ' s micro blog behavior data .
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【参考文献】
相关期刊论文 前10条
1 黄贤英;陈红阳;刘英涛;熊李媛;;一种新的微博短文本特征词选择算法[J];计算机工程与科学;2015年09期
2 刘海峰;姚泽清;苏展;;基于词频的优化互信息文本特征选择方法[J];计算机工程;2014年07期
3 程传鹏;苏安婕;;一种短文本特征词提取的方法[J];计算机应用与软件;2014年06期
4 詹志建;杨小平;;基于语言网络和语义信息的文本相似度计算[J];计算机工程与应用;2014年05期
5 成卫青;唐旋;;一种基于改进互信息和信息熵的文本特征选择方法[J];南京邮电大学学报(自然科学版);2013年05期
6 朱国玮;周利;;基于遗忘函数和领域最近邻的混合推荐研究[J];管理科学学报;2012年05期
7 于洪;李转运;;基于遗忘曲线的协同过滤推荐算法[J];南京大学学报(自然科学版);2010年05期
8 伊雯雯;何福男;;基于用户浏览行为的用户兴趣模型的表示及更新[J];常州信息职业技术学院学报;2010年04期
9 王刚;邱玉辉;;基于本体及相似度的文本聚类研究[J];计算机应用研究;2010年07期
10 黄国言;李有超;高建培;常旭亮;;基于项目属性的用户聚类协同过滤推荐算法[J];计算机工程与设计;2010年05期
相关硕士学位论文 前1条
1 倪卫杰;基于用户兴趣模型的个性化论文推荐系统研究[D];天津大学;2010年
,本文编号:1368518
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1368518.html