基于AT模型的微博用户兴趣挖掘研究
本文关键词:基于AT模型的微博用户兴趣挖掘研究
【摘要】:随着微博的日趋流行与广泛使用,新浪等微博网站已经成为海量信息的来源,虽然传统的文本主题挖掘方法已经得到广泛的应用研究,但对于微博这种特殊结构的文本,传统的挖掘算法不能很好地对其进行研究。为了弥补目前微博平台主题挖掘方法的不足,以及考虑到微博信息的稀疏性,多维性等特点,提出有针对性的预处理方法,将用户微博数据与AT模型结合,通过吉布斯采样进行微博主题挖掘,对作者主题进一步提取得到用户兴趣。通过在真实数据集上的实验,以及与LDA模型对比,证明该模型能有效得到微博主题。
【作者单位】: 辽宁工程技术大学软件学院;
【基金】:国家自然科学基金(No.60903082) 辽宁省教育厅项目(No.L2012113)
【分类号】:TP393.092;TP391.1
【正文快照】: 1引言作为一个提供用户互相交流与分享信息的社交网站,微博以其简单、便捷,传递速度快等特性,受到广大用户的青睐,并风靡全球。著名的Twitter微博网站用户数已经突破5亿[1],而截至2012年8月,新浪微博用户数已达3.65亿。用户不仅可以通过微博网站平台发布自己最新的情况、表达
【参考文献】
中国期刊全文数据库 前8条
1 吴晶;张品;罗辛;盛浩;熊璋;;门户个性化兴趣获取与迁移模式发现[J];计算机研究与发展;2007年08期
2 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
3 康楠;金蓓弘;李京;;面向Blog的兴趣挖掘和推荐系统[J];计算机工程;2008年02期
4 徐戈;王厚峰;;自然语言处理中主题模型的发展[J];计算机学报;2011年08期
5 刁宇峰;杨亮;林鸿飞;;基于LDA模型的博客垃圾评论发现[J];中文信息学报;2011年01期
6 石晶;范猛;李万龙;;基于LDA模型的主题分析[J];自动化学报;2009年12期
7 唐晓波;王洪艳;;基于潜在语义分析的微博主题挖掘模型研究[J];图书情报工作;2012年24期
8 赵爱华;刘培玉;郑燕;;基于LDA的新闻话题子话题划分方法[J];小型微型计算机系统;2013年04期
【共引文献】
中国期刊全文数据库 前10条
1 郭力军;朱群雄;;基于RSS数据源的用户兴趣模型改进及应用[J];北京化工大学学报(自然科学版);2011年01期
2 胡艳丽;白亮;张维明;;网络舆情中一种基于OLDA的在线话题演化方法[J];国防科技大学学报;2012年01期
3 孙乃利;王玉龙;沈奇威;;微博客意见领袖识别的研究[J];电信技术;2012年12期
4 朱然;李德华;;新闻聚合系统中的数据挖掘技术初探[J];电脑知识与技术;2013年01期
5 王君泽;马静;杜洪涛;;微博舆情分析平台的框架与支撑技术研究[J];电子政务;2013年01期
6 葛昊;叶艳;包西林;吴敏;;基于主题模型的英语写作批阅系统个性化推荐模块设计与实现[J];科技和产业;2013年06期
7 王旭仁;姚叶鹏;冉春风;何发镁;;一种并行LDA主题模型建立方法研究[J];北京理工大学学报;2013年06期
8 刘江鸣;徐金安;张玉洁;;基于隐主题马尔科夫模型的多特征自动文摘[J];北京大学学报(自然科学版);2014年01期
9 郑诚;熊大康;刘倩倩;;基于卡方特征选择和LDA主题模型的中文短文本分类[J];电脑知识与技术;2014年13期
10 谈成访;汪材印;;基于LDA模型的新闻话题分类研究[J];电脑知识与技术;2014年16期
中国重要会议论文全文数据库 前2条
1 刘娜;肖智博;路莹;唐晓君;肖鹏;;自适应主题融合的多文档自动摘要算法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
2 丁兆云;王晖;;一种词位置相关的LDA模型[A];2013第一届中国指挥控制大会论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 刘慧君;用户浏览模式挖掘方法与应用研究[D];重庆大学;2010年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 张冬梅;文本情感分类及观点摘要关键问题研究[D];山东大学;2012年
4 贾冬梅;基于数据挖掘方法的聂莉芳教授治疗慢性肾小球肾炎经验研究[D];中国中医科学院;2012年
5 王志军;面向标识商品的RFID网络情境信息管理研究[D];东华大学;2013年
6 罗远胜;跨语言信息检索中双语主题模型及算法研究[D];江西财经大学;2013年
7 段东圣;社会网络中群组探测和话题建模技术研究[D];华中科技大学;2013年
8 陆前;英、汉跨语言话题检测与跟踪技术研究[D];中央民族大学;2013年
9 刘杰;食品安全突发事件跨媒体信息的语义分析与分类研究[D];北京邮电大学;2013年
10 田占伟;基于复杂网络的微博信息传播研究[D];哈尔滨工业大学;2012年
中国硕士学位论文全文数据库 前10条
1 曾凡兴;基于用户兴趣和浏览行为的个性化推荐技术研究[D];江西农业大学;2011年
2 戎怡;局部描述特征结合概率潜在语义模型的场景分类技术研究[D];燕山大学;2010年
3 王嵩;基于贝叶斯理论的社会化标注主题聚类模型研究[D];江苏科技大学;2011年
4 刘星;基于融合分类器的垃圾评论识别方法研究[D];天津大学;2012年
5 刁宇峰;基于博客的作者声誉度分析[D];大连理工大学;2011年
6 刘慧;基于Agent元搜索引擎的个性化研究[D];东华大学;2012年
7 姜杨;基于社会化媒体节点属性的信息预测研究[D];北京邮电大学;2012年
8 刘红艳;基于hLDA层次主题模型的多文档摘要技术研究[D];北京邮电大学;2012年
9 蒋,
本文编号:1163678
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1163678.html