社会化标注中用户动态兴趣主题挖掘
本文关键词:社会化标注中用户动态兴趣主题挖掘 出处:《浙江理工大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 社会化标注 社会化标签 用户兴趣 主题模型 兴趣漂移
【摘要】:在社会化标注中,用户采用标签的方式对自己感兴趣的资源基于自身理解进行无约束标注,标签作为用户所选择的关键词,反映了用户对信息资源的看法及其兴趣所在。用户兴趣的发现获取是个性化推荐的基础和核心,现有研究主要聚焦于从数量和结构上考虑用户与标签的关系,而实际情况往往是,标签只是反映用户兴趣的一个单一词汇,用户的兴趣往往是由多个标签形成的集合所刻画的主题,而且标签随用户标注时序动态变化的特点也会影响用户兴趣的刻画。因此本文结合国家自然科学基金项目“泛在计算环境中社会化驱动的情境感知个性化信息服务研究”(项目编号:71471165),研究了社会化标注中用户动态兴趣主题的挖掘,系统地阐述了用户兴趣主题模型的构建方法,提出了基于动态标签关联指标来挖掘有效的用户兴趣主题并展开实验研究。本文的主要工作和贡献如下:(1)构建了主题模型获取标签主题。以“用户-标签”二元关系为基础,把用户标注信息作为语料库,标签被看作是这个语料库中的词,从而构建LDA模型挖掘潜在的标签主题。将原本杂乱无章、动态变化的标签划分成具有主题的簇,从而克服标签本身的不确定性和不一致性。(2)提出了动态关联指标获取用户标签兴趣。建立关联空间模型来描述用户与标签集的联系,通过分析社会化标签系统的具有时序特征的标注过程,考虑标签的时序特征,定义了反映数量特征的强度指标和反映时间变化的稳定性指标,通过动态关联指标获取用户动态标签兴趣。(3)用户动态兴趣主题挖掘。结合标签主题模型和用户动态标签兴趣,将两者进行相似性计算,得到用户动态兴趣主题,从而有效地实现了用户标签集到用户兴趣主题的动态对应。(4)选取来自Last.fm社会化标注平台中真实的用户标注数据,开展用户兴趣主题挖掘的实验研究,利用覆盖度Acc和准确率Rec对本文提出的基于动态关联指标挖掘的用户兴趣主题模型的有效性进行验证。研究表明,本文提出的基于动态关联指标挖掘的用户兴趣主题在有效性方面有较好表现,且明显优于基于TF方法和基于TF-IDF方法挖掘的用户兴趣主题,研究结果对于个性化推荐具有较高的实践应用价值。
[Abstract]:In social tagging, users use tags to label the resources they are interested in based on their own understanding. Tags are the keywords chosen by users. The discovery of user's interest is the basis and core of personalized recommendation. The existing research mainly focuses on the relationship between user and label in terms of quantity and structure. However, the actual situation is that tags are only a single word that reflects the interests of the user, and the interest of the user is often described by a collection of multiple tags. Moreover, the characteristics of label dynamic change with user tagging time series will also affect the description of user interest. Therefore, this paper combines with the National Natural Science Foundation of China. " Research on social-driven context-aware personalized information service in pervasive computing environment "(. Item No.: 71471165). This paper studies the mining of user's dynamic topic of interest in social tagging, and systematically expounds the method of constructing user's topic of interest model. In this paper, we propose a dynamic tag association index to mine effective user interest topics and carry out experimental research. The main work and contributions of this paper are as follows: 1). The topic model is constructed to get the label theme, which is based on the "user-tag" binary relationship. The user tagged information is regarded as the corpus, and the tag is regarded as the word in the corpus, thus the LDA model is constructed to mine the potential tag topics. Dynamically changing labels are divided into clusters with themes. In order to overcome the uncertainty and inconsistency of label itself, the dynamic association index is proposed to get user tag interest. The association space model is established to describe the relationship between user and tag set. By analyzing the tagging process of the social label system with time series characteristics and considering the time sequence characteristics of the label, the strength index reflecting the quantitative feature and the stability index reflecting the change of time are defined. Through dynamic association index to obtain user dynamic tag interest. 3) user dynamic interest topic mining. Combining tag topic model and user dynamic label interest, the similarity between them is calculated. Get user dynamic topic of interest, thus effectively realize the user tag set to user topic of interest dynamic correspondence. 4) select the real user tagging data from Last.fm social tagging platform. The experimental research of user topic of interest mining is carried out, and the validity of user topic of interest model based on dynamic association index mining is verified by using coverage Acc and accurate rate Rec. The topic of user interest based on dynamic association index mining presented in this paper has a good performance in terms of effectiveness, and is obviously better than that based on TF method and TF-IDF method mining user topic of interest. The research results have high practical value for personalized recommendation.
【学位授予单位】:浙江理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1;F49
【相似文献】
相关期刊论文 前10条
1 王杰;使图像的编辑更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用户兴趣描述[J];华南理工大学学报(自然科学版);2004年S1期
3 董全德;;用户兴趣迁移模式与个性化服务[J];电脑知识与技术(学术交流);2007年17期
4 郑运刚;马建国;;基于分类的用户兴趣漂移模型[J];情报杂志;2008年01期
5 张涛;;基于浏览历史的用户兴趣提取模型[J];软件导刊;2009年06期
6 杨杰;陈恩红;;面向个性化服务的用户兴趣偏移检测及处理方法[J];电子技术;2009年11期
7 陈圣兵;李龙澍;纪霞;;多层次用户兴趣模式的动态捕捉[J];计算机工程与应用;2009年36期
8 郑晓健;庞淑英;何英;;一种面向主题的用户兴趣挖掘模型研究[J];昆明学院学报;2010年03期
9 花青松;刘海峰;胡铮;;基于基尼系数的用户兴趣分布模式度量方法[J];计算机工程;2012年22期
10 孙雨生;刘伟;仇蓉蓉;黄传慧;;国内用户兴趣建模研究进展[J];情报杂志;2013年05期
相关会议论文 前7条
1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
2 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 孙铁利;教巍巍;;基于马尔科夫模型的用户兴趣导航模型系统(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
4 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 李晓黎;史忠植;梁永全;刘福桃;;INTERNET网上一种识别用户兴趣的学习方法[A];第十六届全国数据库学术会议论文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用户兴趣表示研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 王勇;刘奕群;张敏;马少平;茹立云;;基于用户兴趣分析的网页生命周期建模(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关重要报纸文章 前1条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
相关博士学位论文 前9条
1 梁政;面向在线社交网络舆情的信息传播分析关键技术研究[D];国防科学技术大学;2014年
2 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年
3 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年
4 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
5 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
6 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
7 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年
8 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
9 姜邵巍;基于竞争关系的推荐技术研究[D];北京邮电大学;2014年
相关硕士学位论文 前10条
1 陈媛媛;用户兴趣图谱演化机制研究[D];武汉理工大学;2014年
2 梁润庭(Runting Leung);面向微博用户的兴趣识别算法的研究与实现[D];西南交通大学;2015年
3 俞忻峰;新浪微博的数据采集和推荐方案研究[D];南京理工大学;2015年
4 杨梅;基于树型网络的多源用户兴趣数据融合方法研究[D];四川师范大学;2015年
5 石光莲;基于形式概念分析的Folksonomy用户兴趣识别研究[D];西南大学;2015年
6 汤文清;微博用户的兴趣及性格分析[D];上海大学;2015年
7 梅佩;基于浏览内容的用户兴趣研究[D];北京化工大学;2015年
8 张少杰;基于用户兴趣的微博广告投放系统的设计与实现[D];山西大学;2015年
9 黄龙伟;基于蚁群算法的WEB日志用户兴趣路径研究[D];江西师范大学;2015年
10 方正;微博短文本分析技术研究及应用[D];电子科技大学;2014年
,本文编号:1400344
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1400344.html