基于微博内容的博主标签生成关键技术研究
本文选题:微博 + 用户标签 ; 参考:《国防科学技术大学》2014年硕士论文
【摘要】:近几年,以Twitter、新浪微博为代表的微博客(Micro Blog)应用得到了快速的发展。吸引了大量的用户的同时,积累了海量的用户数据。已渐渐的发展成了一种被大众所喜爱的新型媒体。从用户数据中挖掘出用户特征,为微博用户提供个性化的服务,为企业和政府部门提供相关建议,这使得该项研究有着巨大的商业价值和社会价值。本文以微博用户发表的微博内容作为输入数据,运用微博关键词提取、微博用户建模和分类技术,发现微博用户的特征,为微博用户添加一个描述用户特征的标签。本文对关键词提取、用户建模和分类技术进行了深入的研究,主要的工作如下:首先,在微博关键词的提取方面,根据微博短文本的特性,运用TF-IDF算法和Text Rank算法计算词语在微博中的权重;然后将用户的微博转化成空间向量模型,使用聚类算法提取候选关键词;得到候选关键词后,运用n元语法模型对候选关键词扩展;最后根据邻接变化数和语义单元数对扩展后的关键词进行筛选,得到最终的关键词列表。有效的提取出了用户微博中的关键词。然后,在微博用户建模方面,将微博分成原创微博、转发微博、话题微博、主题微博。以用户添加过标签的微博为参照,研究不同微博在表现用户特征方面的不同。结果表明话题微博和主题微博更能够表现出微博用户的特征。基于此提出了一种基于微博类型的用户建模方案,加强了话题微博和主题微博在模型中的权重。有效的提升了建模效果。最后,在用户标签生成方面,以新浪微博平台的官方认证账号发表的微博为训练数据,利用本文的关键词提取方法和用户建模方案,为官方认证账号建立标签模型,为待添加标签用户建立用户模型。运用支持向量机(SVM)的分类功能,为用户生成标签。
[Abstract]:In recent years, Weibo Micro blog, represented by Twitterand Sina Weibo, has developed rapidly.Attract a large number of users at the same time, accumulated a huge amount of user data.Has gradually developed into a popular favorite of the new media.Mining user characteristics from user data, providing personalized services for Weibo users, and providing relevant suggestions for enterprises and government departments make the research have great commercial and social value.In this paper, we take the Weibo content published by Weibo user as the input data, extract the keywords of Weibo, and discover the user's characteristics by the techniques of user modeling and classification. Then we add a label describing the user's characteristics for the user.In this paper, keyword extraction, user modeling and classification techniques are deeply studied. The main work is as follows: firstly, in the aspect of keyword extraction of Weibo, according to the characteristics of the short text of Weibo,TF-IDF algorithm and Text Rank algorithm are used to calculate the weight of the words in Weibo. Then the user's Weibo is transformed into a spatial vector model, and the candidate keywords are extracted by clustering algorithm.Finally, the extended keywords are filtered according to the number of adjacent changes and the number of semantic units, and the final keyword list is obtained.Effective extraction of user Weibo in the key words.Then, in the Weibo user modeling aspect, the Weibo is divided into the original Weibo, forwards Weibo, the topic #china_person-, the theme Weibo.Taking Weibo, who has been tagged, as a reference, this paper studies the differences of user characteristics between the two groups.The results show that the topic Weibo and the theme Weibo are more able to show the characteristics of the user.Based on this, a user modeling scheme based on Weibo type is proposed, which strengthens the weight of the topic Weibo and the theme Weibo in the model.The modeling effect is improved effectively.Finally, in the aspect of user label generation, the official authentication account of Sina Weibo platform is used as training data, and the keyword extraction method and user modeling scheme are used to establish tag model for official authentication account.Create a user model for the user to be tagged.Support Vector Machine (SVM) is used to generate tags for users.
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092;TP391.1
【相似文献】
相关期刊论文 前10条
1 江淇;李广建;;用户建模中的可重用性问题研究[J];现代图书情报技术;2005年12期
2 董峰;王燕;;各种用户建模方法在个性化服务中的比较研究[J];软件导刊;2013年09期
3 王巧容;赵海燕;曹健;;个性化服务中的用户建模技术[J];小型微型计算机系统;2011年01期
4 武瑞娟;周兴社;王海鹏;王柱;;普适环境下的群体用户建模机制研究[J];计算机科学;2009年05期
5 戢n<钧;;面向个性化服务的用户建模相关问题研究[J];情报杂志;2006年03期
6 杨涛,王云莉,肖田元,张林宣;主动设计知识服务系统中的用户建模研究[J];系统仿真学报;2003年02期
7 牛亚真;祝忠明;;个性化服务中跨系统用户建模方法研究综述[J];现代图书情报技术;2012年05期
8 余先虎,马敏飞;Internet个性化服务及其发展[J];宁波广播电视大学学报;2004年03期
9 张瑜;苏晓路;刘世洪;李景;胡海燕;;基于本体的农业科技信息用户建模系统设计与实现[J];现代图书情报技术;2009年11期
10 张建华;汪强;马新明;席磊;;无公害农产品认证资源共享中的用户建模研究[J];河南科学;2013年01期
相关会议论文 前1条
1 谭继志;罗匡;王衡;汪国平;;智能接听系统中的用户建模与算法研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年
相关重要报纸文章 前2条
1 应晓敏 窦文华;技术架构[N];计算机世界;2003年
2 应晓敏 窦文华;实现途径[N];计算机世界;2003年
相关博士学位论文 前3条
1 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
2 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
3 李文峰;基于主题模型的用户建模研究[D];北京邮电大学;2013年
相关硕士学位论文 前10条
1 周丰;面向需求的用户建模及服务推荐研究[D];复旦大学;2014年
2 黎斌;面向URL的用户建模关键技术研究[D];哈尔滨工业大学;2016年
3 孙兴东;基于微博内容的博主标签生成关键技术研究[D];国防科学技术大学;2014年
4 朱东雪;基于潜在主题的个性化搜索引擎用户建模[D];西北师范大学;2016年
5 李荣;人机交互中用户建模方法的研究[D];南京师范大学;2004年
6 张炜;个性化推荐系统中基于本体的用户建模研究[D];南京理工大学;2007年
7 刘茵;基于网页标记和词组的用户建模技术[D];广西大学;2007年
8 张瑜;基于本体的农业科技信息用户建模系统研究[D];中国农业科学院;2009年
9 李驰;基于XML的个性化信息服务[D];河北大学;2005年
10 吴阳s,
本文编号:1731945
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1731945.html