微博用户的兴趣及性格分析
[Abstract]:With the rapid popularity of the Internet, people transition from an era of information scarcity to an era of information explosion. In such an era, how to obtain the information needed more accurately will be a difficult point. Weibo is a new type of social network services and Internet media features of the platform. It can help users to obtain or publish information in real time. Providing more personalized services based on this new media platform will further help users to obtain more accurate and real-time content of interest. Before this, the system must first analyze the user's interests and other information. This article is aimed at this research hot spot, based on Weibo text carries on the analysis to the user information. This article mainly carries on the comprehensive analysis to the Sina Weibo platform Weibo text. The characteristic of the research is that only Weibo text is used as the data object to analyze the user's information from many aspects. In this paper, we analyze the user's interest, emotion and character in Weibo's text, and then get the user's information. The first aspect is to analyze the user's interest from Weibo's text and express the user's interest at macro and micro level. In this paper, the possible impurities in the relation matrix between the words and the subject are eliminated in the training result of the direct use of the topic model by using the three element filter method, and then the topic probability distribution of the single Weibo text is obtained by using the WTMR (Word-themes mutual reinforcement) model). On the basis of obtaining the subject probability distribution of a single Weibo text, this paper uses WTMR model again to obtain the topic probability distribution of Weibo text set, that is, the topic probability distribution of the user's interest information. At the same time, pseudo-long text and greedy strategy are used to extract the keywords of interest to identify the subject of interest to the user. Integrating the topic probability distribution and key words of user interest to obtain user interest. Experiments show that this method can extract user interest in Weibo text accurately and easily. The second aspect is to analyze the emotion in Weibo's text. The DLDA (Double Latent Dirichlet Allocation) model is proposed by improving the classical method of topic model LDA (Latent Dirichlet Allocation),. Improve LDA. by treating the semantic and emotional implications of the text as equal relations At the same time, use different word weights to optimize Gibbs Sampling. The experimental results show that this method can more accurately analyze the emotional polarity contained in Weibo's text. The third aspect is to analyze the character of the user contained in Weibo's text. Based on the SC-LIWC dictionary, the user character contained in Weibo's text is obtained. The SC-LIWC dictionary and Big Five Model theory are used to obtain the five types of personality factors corresponding to each word in Weibo's text. Then, the WTMR model is used to mine the user's character information from Weibo's text. The experimental results show that the proposed method can accurately calculate the user character in Weibo's text. This paper analyzes the user's interest, emotion and character in Weibo's text. In order to better show the results of this study, this paper designs a personalized Weibo service system based on the above three research results. It includes three different types of personalized services: personalized Weibo sorting, text cloud reading and user character analysis assistant. In addition to providing users with more efficient access to information, these three services can also be used to analyze users' personality information.
【学位授予单位】:上海大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092;TP391.1
【相似文献】
相关期刊论文 前10条
1 王杰;使图像的编辑更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用户兴趣描述[J];华南理工大学学报(自然科学版);2004年S1期
3 董全德;;用户兴趣迁移模式与个性化服务[J];电脑知识与技术(学术交流);2007年17期
4 郑运刚;马建国;;基于分类的用户兴趣漂移模型[J];情报杂志;2008年01期
5 张涛;;基于浏览历史的用户兴趣提取模型[J];软件导刊;2009年06期
6 杨杰;陈恩红;;面向个性化服务的用户兴趣偏移检测及处理方法[J];电子技术;2009年11期
7 陈圣兵;李龙澍;纪霞;;多层次用户兴趣模式的动态捕捉[J];计算机工程与应用;2009年36期
8 郑晓健;庞淑英;何英;;一种面向主题的用户兴趣挖掘模型研究[J];昆明学院学报;2010年03期
9 花青松;刘海峰;胡铮;;基于基尼系数的用户兴趣分布模式度量方法[J];计算机工程;2012年22期
10 孙雨生;刘伟;仇蓉蓉;黄传慧;;国内用户兴趣建模研究进展[J];情报杂志;2013年05期
相关会议论文 前7条
1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
2 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 孙铁利;教巍巍;;基于马尔科夫模型的用户兴趣导航模型系统(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
4 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 李晓黎;史忠植;梁永全;刘福桃;;INTERNET网上一种识别用户兴趣的学习方法[A];第十六届全国数据库学术会议论文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用户兴趣表示研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 王勇;刘奕群;张敏;马少平;茹立云;;基于用户兴趣分析的网页生命周期建模(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关重要报纸文章 前1条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
相关博士学位论文 前8条
1 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年
2 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年
3 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
4 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
5 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
6 李东胜;基于兴趣与保护隐私的在线社区推荐技术研究[D];复旦大学;2012年
7 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
8 姜邵巍;基于竞争关系的推荐技术研究[D];北京邮电大学;2014年
相关硕士学位论文 前10条
1 梁润庭(Runting Leung);面向微博用户的兴趣识别算法的研究与实现[D];西南交通大学;2015年
2 俞忻峰;新浪微博的数据采集和推荐方案研究[D];南京理工大学;2015年
3 杨梅;基于树型网络的多源用户兴趣数据融合方法研究[D];四川师范大学;2015年
4 石光莲;基于形式概念分析的Folksonomy用户兴趣识别研究[D];西南大学;2015年
5 汤文清;微博用户的兴趣及性格分析[D];上海大学;2015年
6 蒋萍;基于用户兴趣挖掘的个性化模型研究与设计[D];苏州大学;2005年
7 兰杨;移动个性化信息服务中用户兴趣建模的研究[D];电子科技大学;2009年
8 孙威;微博用户兴趣挖掘与建模研究[D];大连理工大学;2012年
9 王广新;基于微博的用户兴趣分析与个性化信息推荐[D];上海交通大学;2013年
10 李致;知识库系统中的用户兴趣挖掘与推荐[D];北京交通大学;2013年
,本文编号:2408290
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2408290.html