基于主题模型的用户画像提取算法研究
发布时间:2017-11-03 17:14
本文关键词:基于主题模型的用户画像提取算法研究
更多相关文章: 用户画像 主题模型 Latent Dirichlet Allocation 社交策展网络 推荐系统
【摘要】:社交网络以及以社交为基础的互联网应用的迅猛发展带来数据的爆炸式增长,提出了个性化推荐的应用需求。用户画像提取是个性化推荐的关键。近年来社交网络的发展趋势是媒体类型不断丰富,用户参与门槛的不断降低。用户表达的数据模态多样,为用户画像提取提供了更广阔的空间。本论文针对新型社交网络——社交策展网络数据,开展用户画像提取研究,具体工作如下:1.提出了一种结合主题模型和点互信息的用户画像提取(TM-PMI)方法。从LDA模型的思想、原理以及LDA求解方法—吉布斯采样等全面描述了用户文本信息建模的方法。将用户文本信息主题模型和点互信息结合建立用户个性化主题词,得到个性化用户画像。通过对用户推荐收藏条目进行实验验证。设计了一种User Study的方法。实验结果表明,相比于传统LDA模型,TM-PMI表达能力更好,推荐结果也得到提升。2.提出了一种社交策展网络多层LDA模型(MLLLDA)的用户潜在兴趣画像提取的方法。分析社交策展网络“转发链”的特点,针对社交策展网络用户两种模态数据——收藏条目的描述文本信息和转发链的用户ID集合,结合用户收藏条目描述文本信息的潜在主题分布以及转发链上用户ID的兴趣分布计算用户潜在兴趣分布,用于社区发现。并计算目标用户和每个用户IDJensen-Shannon散度值,进行用户推荐。实验结果表明MLLDA可以有效发现用户社区,并得到有效的用户推荐。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
,
本文编号:1137137
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1137137.html