微博用户兴趣识别技术的研究与应用
本文关键词:微博用户兴趣识别技术的研究与应用
更多相关文章: 主题模型 卷积神经网络 微博分类 用户兴趣识别
【摘要】:随着移动互联网技术的发展及移动终端的普及,网络上出现了许多社交类的网站和应用,微博由于其自身操作简单,传播快速等特性,聚集了大量用户。每个用户每天可以接收成百上千条微博,从而导致信息过载的问题,严重影响用户对信息及知识的获取。此外,越来越多的商家将微博作为营销平台,因此如何完成高质量的广告定向投放也成为一个具有重要商业价值的问题。微博用户的兴趣识别可以帮助解决上述问题。本文的主要工作如下:本文首先尝试了基于主题模型的用户兴趣识别。将用户的微博集合看作一篇文档,使用Labeled LDA主题模型对用户微博文档的主题进行预测,获得的主题分布看作是用户的兴趣主题分布。该方法的问题是,当兴趣词周围存在大量噪声词时,Labeled LDA主题模型对用户兴趣词的主题分配会随上下文而发生严重偏移,从而导致用户兴趣识别错误。其次本文尝试了基于微博分类的用户兴趣识别,通过对用户的微博进行逐条兴趣分类,从而缓解噪声词对兴趣词的影响,然后通过用户微博的兴趣类别分布识别用户兴趣。尝试了两个分类器,一个是以二字串bigram作为特征单元的线性SVM,另一个是使用卷积神经网络实现的分类器。实验结果表明,基于微博分类的兴趣识别方法的效果优于基于主题模型的方法,但上述两个分类器对于包含噪声词较多的微博分类效果还有提升空间。第三提出一种基于主题增强卷积神经网络的用户兴趣识别方法,通过构建一个结合连续的语义特征和离散的主题特征的双通道CNN作为微博分类器,对用户的微博进行兴趣分类,通过极大似然估计得到微博用户的兴趣。实验结果表明使用融合主题信息的主题增强CNN将显著提高用户兴趣识别的效果。最后一部分介绍了兴趣模型的一个应用,聊天机器人笨笨的新闻推荐模块,该模块基于LDA主题模型,负责为用户提供个性化的新闻推荐服务。
【关键词】:主题模型 卷积神经网络 微博分类 用户兴趣识别
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-17
- 1.1 课题背景及研究目的和意义9-11
- 1.1.1 课题背景9-10
- 1.1.2 课题研究的目的及意义10-11
- 1.2 国内外研究现状11-14
- 1.2.1 国外研究现状11-13
- 1.2.2 国内研究现状13-14
- 1.3 本文的研究内容及章节安排14-17
- 1.3.1 本文的研究内容14-15
- 1.3.2 本文的章节安排15-17
- 第2章 基于主题模型的用户兴趣识别17-27
- 2.1 引言17
- 2.2 Labeled LDA主题模型17-19
- 2.2.1 主题生成过程17-19
- 2.2.2 学习和预测19
- 2.3 基于Labeled LDA主题模型的用户兴趣识别19-24
- 2.3.1 兴趣类别体系19-20
- 2.3.2 实验数据20-21
- 2.3.3 训练阶段21-22
- 2.3.4 预测阶段22-23
- 2.3.5 用户兴趣的获取23-24
- 2.4 实验结果及分析24-26
- 2.4.1 评价标准24
- 2.4.2 实验结果24-25
- 2.4.3 实验结果分析25-26
- 2.5 本章小结26-27
- 第3章 基于微博分类的用户兴趣识别27-42
- 3.1 引言27
- 3.2 支持向量机27-32
- 3.2.1 支持向量机简介27-28
- 3.2.2 线性支持向量机28-30
- 3.2.3 多元分类SVM30-32
- 3.3 卷积神经网络32-34
- 3.3.1 卷积神经网络简介32
- 3.3.2 构件32-34
- 3.4 实验方法与数据34-36
- 3.4.1 实验方法34-36
- 3.4.2 实验数据36
- 3.5 实验结果及分析36-40
- 3.5.1 实验评价指标36-37
- 3.5.2 微博分类实验结果37-38
- 3.5.3 实例分析38-39
- 3.5.4 用户兴趣识别实验结果39-40
- 3.5.5 实验结果分析40
- 3.6 本章小结40-42
- 第4章 基于主题增强卷积神经网络的用户兴趣识别42-53
- 4.1 引言42
- 4.2 模型结构42-44
- 4.3 实验方法与数据44-45
- 4.3.1 实验方法44-45
- 4.3.2 实验数据45
- 4.4 实验结果与分析45-52
- 4.4.1 实验评价指标45
- 4.4.2 微博分类实验结果45-46
- 4.4.3 实例分析46-49
- 4.4.4 用户兴趣识别实验结果49-51
- 4.4.5 实验结果分析51-52
- 4.5 本章小结52-53
- 第5章 聊天机器人笨笨的新闻推荐模块53-61
- 5.1 引言53
- 5.2 动机53-54
- 5.3 个性化新闻推荐54-55
- 5.4 新闻推荐模块的处理流程55-60
- 5.5 新闻推荐模块的效果60
- 5.6 本章小结60-61
- 结论61-62
- 参考文献62-67
- 致谢67
【相似文献】
中国期刊全文数据库 前10条
1 王杰;使图像的编辑更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用户兴趣描述[J];华南理工大学学报(自然科学版);2004年S1期
3 董全德;;用户兴趣迁移模式与个性化服务[J];电脑知识与技术(学术交流);2007年17期
4 郑运刚;马建国;;基于分类的用户兴趣漂移模型[J];情报杂志;2008年01期
5 张涛;;基于浏览历史的用户兴趣提取模型[J];软件导刊;2009年06期
6 杨杰;陈恩红;;面向个性化服务的用户兴趣偏移检测及处理方法[J];电子技术;2009年11期
7 陈圣兵;李龙澍;纪霞;;多层次用户兴趣模式的动态捕捉[J];计算机工程与应用;2009年36期
8 郑晓健;庞淑英;何英;;一种面向主题的用户兴趣挖掘模型研究[J];昆明学院学报;2010年03期
9 花青松;刘海峰;胡铮;;基于基尼系数的用户兴趣分布模式度量方法[J];计算机工程;2012年22期
10 孙雨生;刘伟;仇蓉蓉;黄传慧;;国内用户兴趣建模研究进展[J];情报杂志;2013年05期
中国重要会议论文全文数据库 前7条
1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
2 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 孙铁利;教巍巍;;基于马尔科夫模型的用户兴趣导航模型系统(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
4 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 李晓黎;史忠植;梁永全;刘福桃;;INTERNET网上一种识别用户兴趣的学习方法[A];第十六届全国数据库学术会议论文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用户兴趣表示研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 王勇;刘奕群;张敏;马少平;茹立云;;基于用户兴趣分析的网页生命周期建模(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前1条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
中国博士学位论文全文数据库 前8条
1 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年
2 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年
3 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
4 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
5 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
6 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年
7 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
8 姜邵巍;基于竞争关系的推荐技术研究[D];北京邮电大学;2014年
中国硕士学位论文全文数据库 前10条
1 陈媛媛;用户兴趣图谱演化机制研究[D];武汉理工大学;2014年
2 梁润庭(Runting Leung);面向微博用户的兴趣识别算法的研究与实现[D];西南交通大学;2015年
3 俞忻峰;新浪微博的数据采集和推荐方案研究[D];南京理工大学;2015年
4 杨梅;基于树型网络的多源用户兴趣数据融合方法研究[D];四川师范大学;2015年
5 石光莲;基于形式概念分析的Folksonomy用户兴趣识别研究[D];西南大学;2015年
6 汤文清;微博用户的兴趣及性格分析[D];上海大学;2015年
7 梅佩;基于浏览内容的用户兴趣研究[D];北京化工大学;2015年
8 张少杰;基于用户兴趣的微博广告投放系统的设计与实现[D];山西大学;2015年
9 黄龙伟;基于蚁群算法的WEB日志用户兴趣路径研究[D];江西师范大学;2015年
10 方正;微博短文本分析技术研究及应用[D];电子科技大学;2014年
本文关键词:微博用户兴趣识别技术的研究与应用
更多相关文章: 主题模型 卷积神经网络 微博分类 用户兴趣识别
,
本文编号:511772
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/511772.html