当前位置:主页 > 科技论文 > 软件论文 >

基于LDA主题模型的用户兴趣发现方法

发布时间:2017-10-02 17:34

  本文关键词:基于LDA主题模型的用户兴趣发现方法


  更多相关文章: 用户兴趣 短文本 LDA 特征拓展 K-means


【摘要】:用户兴趣是对微博用户研究的重要内容,本文使用聚类方法提取用户兴趣。由于微博短文本的特征稀疏和上下文依赖性,传统方法不能取得良好的效果。本文对微博短文本进行基于LDA主题模型的特征拓展处理。LDA主题模型引入隐含主题,通过主题相似性,在一定程度上拓展文本特征,弥补原文本特征稀疏的缺点。并且,在处理多义词时,主题相似性能明显区分不同词义,以解决上下文依赖问题。在此基础上,通过文本聚类方法提取用户兴趣。通过实验表明,在引入LDA模型下,聚类效果和用户兴趣抽取的到明显提升,有效解决的微博用户兴趣发现中文博短文本特征稀疏和上下文依赖问题。
【作者单位】: 北京邮电大学计算机学院;
【关键词】用户兴趣 短文本 LDA 特征拓展 K-means
【基金】:国家重点基础研究发展计划(973)(2013CB329606)
【分类号】:TP391.1
【正文快照】: 0引言用户兴趣是对微博用户研究的重要内容,本研究中使用文本聚类方法发掘用户兴趣,文本聚类技术一直是文本挖掘领域的重要内容。而微博短文本由于具有短小、新词多、不规范等特点,如果直接使用传统的方法往往不能取得很好的效果。对微博文本的研究,具有十分重要的理论研究和

【参考文献】

中国期刊全文数据库 前1条

1 杨亮;林原;林鸿飞;;基于情感分布的微博热点事件发现[J];中文信息学报;2012年01期

【共引文献】

中国期刊全文数据库 前10条

1 邵力;乔墩;;网络热点事件微博评论中的情感冲突分析[J];兰州大学学报(社会科学版);2016年06期

2 李燕飞;;高校心理困难学生动态监测系统的建构[J];赤峰学院学报(自然科学版);2016年17期

3 李明;王高飞;;基于微博平台的企业网络口碑危机预警研究[J];北方经贸;2016年08期

4 万红新;彭云;郑睿颖;;时序化LDA的舆情文本动态主题提取[J];计算机与现代化;2016年07期

5 张梅;程利伟;;基于Apriori算法的事件识别方法研究[J];数字技术与应用;2016年05期

6 陈福;林闯;薛超;徐月梅;孟坤;倪艺函;;短句语义向量计算方法[J];通信学报;2016年02期

7 李进华;安仲杰;;基于地理坐标的微博事件检测与分析[J];现代图书情报技术;2016年02期

8 王冠群;田雪;黄德根;张婧;;中文微博观点句识别及要素抽取研究[J];数据采集与处理;2016年01期

9 邓佳煜;;突发性公共危机在微博平台上的传播——以昆明火车站暴力恐怖事件为例[J];新媒体研究;2015年18期

10 胡改丽;陈婷;陈福集;郑小雪;;我国网络舆情热度分析文献综述[J];情报科学;2016年01期

【二级参考文献】

中国期刊全文数据库 前7条

1 黎志升;王煦法;;基于Language Model的地理信息检索模型(英文)[J];中国科学技术大学学报;2010年02期

2 陈建美;林鸿飞;杨志豪;;基于语法的情感词汇自动获取[J];智能系统学报;2009年02期

3 刘康;赵军;;基于层叠CRFs模型的句子褒贬度分析研究[J];中文信息学报;2008年01期

4 邢永康;马少平;;统计语言模型综述[J];计算机科学;2003年09期

5 李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;2003年17期

6 徐琳宏;林鸿飞;潘宇;任惠;陈建美;;情感词汇本体的构造[J];情报学报;2008年02期

7 陈建美;林鸿飞;;中文情感常识知识库的构建[J];情报学报;2009年04期

【相似文献】

中国期刊全文数据库 前10条

1 王杰;使图像的编辑更加容易[J];中文信息;1998年Z1期

2 王波,姚敏;基于信息抽取的匿名用户兴趣描述[J];华南理工大学学报(自然科学版);2004年S1期

3 董全德;;用户兴趣迁移模式与个性化服务[J];电脑知识与技术(学术交流);2007年17期

4 郑运刚;马建国;;基于分类的用户兴趣漂移模型[J];情报杂志;2008年01期

5 张涛;;基于浏览历史的用户兴趣提取模型[J];软件导刊;2009年06期

6 杨杰;陈恩红;;面向个性化服务的用户兴趣偏移检测及处理方法[J];电子技术;2009年11期

7 陈圣兵;李龙澍;纪霞;;多层次用户兴趣模式的动态捕捉[J];计算机工程与应用;2009年36期

8 郑晓健;庞淑英;何英;;一种面向主题的用户兴趣挖掘模型研究[J];昆明学院学报;2010年03期

9 花青松;刘海峰;胡铮;;基于基尼系数的用户兴趣分布模式度量方法[J];计算机工程;2012年22期

10 孙雨生;刘伟;仇蓉蓉;黄传慧;;国内用户兴趣建模研究进展[J];情报杂志;2013年05期

中国重要会议论文全文数据库 前7条

1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年

2 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

3 孙铁利;教巍巍;;基于马尔科夫模型的用户兴趣导航模型系统(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

4 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

5 李晓黎;史忠植;梁永全;刘福桃;;INTERNET网上一种识别用户兴趣的学习方法[A];第十六届全国数据库学术会议论文集[C];1999年

6 田萱;杜小勇;;基于SAM模型的用户兴趣表示研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

7 王勇;刘奕群;张敏;马少平;茹立云;;基于用户兴趣分析的网页生命周期建模(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

中国重要报纸全文数据库 前1条

1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年

中国博士学位论文全文数据库 前9条

1 梁政;面向在线社交网络舆情的信息传播分析关键技术研究[D];国防科学技术大学;2014年

2 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年

3 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年

4 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年

5 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年

6 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年

7 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年

8 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年

9 姜邵巍;基于竞争关系的推荐技术研究[D];北京邮电大学;2014年

中国硕士学位论文全文数据库 前10条

1 陈媛媛;用户兴趣图谱演化机制研究[D];武汉理工大学;2014年

2 梁润庭(Runting Leung);面向微博用户的兴趣识别算法的研究与实现[D];西南交通大学;2015年

3 俞忻峰;新浪微博的数据采集和推荐方案研究[D];南京理工大学;2015年

4 杨梅;基于树型网络的多源用户兴趣数据融合方法研究[D];四川师范大学;2015年

5 石光莲;基于形式概念分析的Folksonomy用户兴趣识别研究[D];西南大学;2015年

6 汤文清;微博用户的兴趣及性格分析[D];上海大学;2015年

7 梅佩;基于浏览内容的用户兴趣研究[D];北京化工大学;2015年

8 张少杰;基于用户兴趣的微博广告投放系统的设计与实现[D];山西大学;2015年

9 黄龙伟;基于蚁群算法的WEB日志用户兴趣路径研究[D];江西师范大学;2015年

10 方正;微博短文本分析技术研究及应用[D];电子科技大学;2014年



本文编号:960956

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/960956.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4aed8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com