基于Web浏览行为的用户兴趣模型研究
发布时间:2017-10-02 07:00
本文关键词:基于Web浏览行为的用户兴趣模型研究
【摘要】:近年来,随着因特网的迅猛发展,web信息呈几何级数增长,人们需要花费大量时间才能找到自己需要的信息,个性化推荐作为信息过滤的重要手段,是解决当前信息过载问题的一种很有效的方法。而用户兴趣模型是个性化推荐系统的核心,一个良好的兴趣模型能够更好的改善用户的上网体验和信息利用效率,因此兴趣模型的研究成为了学术界和IT界的热门课题。论文以文本信息处理技术为基点,以建立有效的兴趣模型为目标。主要围绕着用户兴趣度度量和兴趣模型的表示更新两方面展开研究工作,并建立有实际应用意义的新闻推荐系统。论文的主要内容如下:(1)针对现有用户兴趣模型在模型建立阶段用户兴趣评价的不足,提出了一种基于混合行为评价兴趣度值的方法,突出了用户阅读时间的特殊性,在用户阅读时间异常的情况下利用其它浏览行为来量化用户兴趣度,并将此得到的兴趣度应用到传统VSM模型中,使拓展后的兴趣模型同时携带了内容和行为信息。(2)针对用户兴趣模型建立后,随之而来的系统存储量、计算量剧增问题,提出了时间分段机制对兴趣模型进行优化,达到了降低兴趣模型计算量和存储量的目的。另外,由于人的兴趣随着时间不断进行变化,在时间分段机制的基础上,提出了用户兴趣漂移机制,用以反映人的兴趣变化规律,使得到的兴趣模型更加准确。(3)基于兴趣模型理论基础构建了新闻推荐系统,采集了2000篇新闻网页作为数据集,系统持续采集用户浏览行为,分析用户兴趣,建立并更新用户兴趣模型,最终根据兴趣模型向用户提供网页推荐。经过实验和观察,验证了本文提出的基于混合行为兴趣度的用户兴趣模型的合理性和有效性。
【关键词】:兴趣模型 兴趣度 兴趣漂移 新闻推荐系统
【学位授予单位】:西南科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
- 摘要4-5
- Abstract5-10
- 1 绪论10-15
- 1.1 课题的研究背景10-11
- 1.2 研究现状11-13
- 1.2.1 个性化推荐服务的研究现状11-12
- 1.2.2 用户兴趣模型的研究现状12-13
- 1.3 课题来源13
- 1.4 论文的研究内容和组织结构13-15
- 2 文本信息处理技术15-27
- 2.1 文本信息处理概述15
- 2.2 中文分词技术15-17
- 2.2.1 中文分词算法思想16
- 2.2.2 中文分词算法应用16
- 2.2.3 词性标注16-17
- 2.3 文本内容表征17-22
- 2.3.1 VSM模型基本思想18
- 2.3.2 文本特征选择算法18-19
- 2.3.3 改进的TF-IDF算法19-21
- 2.3.4 VSM模型的应用21-22
- 2.4 文本相似度度量算法22-23
- 2.5 文本聚类算法23-25
- 2.5.1 K-Means聚类算法24
- 2.5.2 凝聚聚类算法24-25
- 2.6 本章小结25-27
- 3 基于用户浏览行为的用户兴趣度度量方法27-37
- 3.1 用户兴趣获取方式27-28
- 3.2 用户浏览行为分析28-29
- 3.3 基于用户混合行为的兴趣度度量方法29-35
- 3.3.1 用户混合行为组合29-30
- 3.3.2 基于重要行为的兴趣度计算30-31
- 3.3.3 基于用户阅读时间的兴趣度计算31-33
- 3.3.4 基于其他行为的兴趣度计算33-35
- 3.4 本章小结35-37
- 4 用户兴趣模型研究37-46
- 4.1 用户兴趣模型建立37-41
- 4.1.1 用户兴趣模型表示37-38
- 4.1.2 用户兴趣模型相关运算38-41
- 4.1.3 用户兴趣模型初始化41
- 4.2 用户兴趣模型更新41-44
- 4.2.1 时间分段机制42
- 4.2.2 用户兴趣漂移机制42-44
- 4.3 用户兴趣模型应用44-45
- 4.4 本章小结45-46
- 5 基于用户兴趣模型的个性化推荐系统46-68
- 5.1 个性化推荐系统概述46
- 5.2 系统实现46-56
- 5.2.1 系统环境46-47
- 5.2.2 系统实现技术47-50
- 5.2.3 数据采集部分50-51
- 5.2.4 数据库建模51-53
- 5.2.5 部分前端页面展示53-56
- 5.3 系统结构56-58
- 5.3.1 文本表征模块57
- 5.3.2 兴趣分析模块57-58
- 5.3.3 内容推荐模块58
- 5.3.4 外部接.模块58
- 5.4 用户兴趣模型算法验证58-67
- 5.4.1 用户兴趣度度量方法验证58-60
- 5.4.2 改进的TF-IDF算法验证60-61
- 5.4.3 用户兴趣矩阵聚合运算算法验证61-64
- 5.4.4 用户兴趣模型漂移机制验证64-67
- 5.5 本章小结67-68
- 结论68-70
- 致谢70-71
- 参考文献71-76
- 攻读学位期间发表的相关学术论文及研究成果76
【参考文献】
中国期刊全文数据库 前3条
1 陈一峰;赵恒凯;余小清;万旺根;;基于本体的用户兴趣模型构建研究[J];计算机工程;2010年21期
2 曹永春;蔡正琦;邵亚斌;;基于K-means的改进人工蜂群聚类算法[J];计算机应用;2014年01期
3 史宝明;贺元香;张永;;个性化信息检索中用户兴趣建模与更新研究[J];计算机应用与软件;2014年03期
,本文编号:958158
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/958158.html