当前位置:主页 > 科技论文 > 软件论文 >

微博用户个性化标签提取技术研究

发布时间:2018-11-04 11:49
【摘要】:微博用户标签由于能反映用户特征,用户偏好等信息,并且用户标签对用户广告推荐,用户聚类,用户查找等都有一定潜在价值,因此研究微博用户标签提取有一定实际意义。本文研究的微博用户个性化标签中的个性化包含两层含义,一是标签能反应用户的个性化特征,二是标签自身包含相应的个性化特征。标签反应用户的个性化特征的程度本文通过与用户手动提取的标签对比进行判断,标签自身包含的个性化特征是指对标签进行的进一步分类处理,使用户的标签之间带有共同属性,以便于对用户进行查找,聚类等。本文通过研究发现用户自提标签中存在三种基础类型的标签,本文分别称为基础标签,分类标签,关注标签,之后分别研究了每种基础类型标签的特点,并根据每种基础类型标签的特点设计了相应的提取方法,之后又根据三种基础类型标签之间的关系,研究如何将三者综合到一起,得到更好的反应用户个性化特征的标签。因此本文对用户个性化标签的提取过程中共涉及到七种标签提取方法,其中三种方法提取的为基础类型的标签,另外四种方法则是这三种基础类型标签之间的混合标签,除基础类型标签中的基础标签的提取方法是使用的已有算法TextRank算法外,其余六种标签提取方法均是本文所提出。通过最后的验证实验发现,三种基础类型标签的混合标签提取效果最好,因此,本文所研究的用户标签提取方法使用户个性化标签提取的效果得到了改进。另外,本文对提取出来的用户个性化标签进行进一步分类处理之后,使微博用户的标签之间带有了更多共性的信息,对用户聚类,用户分类,用户查找等也带来了一定好处,使用户标签的应用范围变得更加广泛。
[Abstract]:Weibo user tags can reflect the characteristics of users, user preferences and other information, and user tags to the user advertising recommendation, user clustering, user search and so on have a certain potential value. In this paper, the personality of Weibo user personalized tag contains two meanings, one is that the tag can reflect the personalized characteristics of the user, the other is that the tag itself contains the corresponding personalized features. Tags reflect the degree of personalized features of the user this paper compares with the tags extracted by the user manually. The personalized features contained in the tags refer to the further classification of the tags. Make the user's tags with common attributes, to facilitate the user to find, clustering, and so on. In this paper, we find out that there are three basic types of tags in user self-removal tags, which are called basic label, classified label, concern label, and then the characteristics of each basic type tag are studied respectively. According to the characteristics of each basic type label, the corresponding extraction method is designed, and then according to the relationship between the three basic type tags, how to integrate the three labels together to get a better response to the personalized features of the user tags. Therefore, in this paper, there are seven kinds of tag extraction methods involved in the process of user personalized tag extraction, three of which are based on tags, the other four are mixed tags between these three basic types of tags. Except for the existing TextRank algorithm which is used to extract the basic label in the basic type tag, the other six label extraction methods are all proposed in this paper. Through the final verification experiment, it is found that the mixed tag extraction effect of the three basic types of tags is the best. Therefore, the user tag extraction method studied in this paper has improved the effect of user personalized tag extraction. In addition, after further classifying the extracted user personalized tags, this paper makes Weibo user tags with more common information, which also brings certain benefits to user clustering, user classification, user search, and so on. Make user label's application scope more extensive.
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.092;TP311.13

【相似文献】

相关期刊论文 前10条

1 王翠英;;标签的聚类分析研究[J];现代图书情报技术;2008年05期

2 林茜卡;傅秀芬;滕少华;李云;;协同标签系统的应用研究[J];暨南大学学报(自然科学与医学版);2009年01期

3 吴超;周波;;基于复杂网络的社会化标签分析[J];浙江大学学报(工学版);2010年11期

4 吴金成;曹娇;赵文栋;张磊;;标签集中式发布订阅机制性能分析[J];指挥控制与仿真;2010年06期

5 李晓燕;陈刚;寿黎但;董金祥;;一种面向协作标签系统的图片检索聚类方法[J];中国图象图形学报;2010年11期

6 袁柳;张龙波;;基于概率主题模型的标签预测[J];计算机科学;2011年07期

7 张斌;张引;高克宁;郭朋伟;孙达明;;融合关系与内容分析的社会标签推荐[J];软件学报;2012年03期

8 王永刚;严寒冰;许俊峰;胡建斌;陈钟;;垃圾标签的抵御方法研究[J];计算机研究与发展;2013年10期

9 汪祥;贾焰;周斌;陈儒华;韩毅;;基于交互关系的微博用户标签预测[J];计算机工程与科学;2013年10期

10 顾亦然;陈敏;;一种三部图网络中标签时间加权的推荐方法[J];计算机科学;2012年08期

相关会议论文 前6条

1 朱广飞;董超;王衡;汪国平;;照片标签的智能化管理[A];第四届和谐人机环境联合学术会议论文集[C];2008年

2 房冠南;袁彩霞;王小捷;李江;宋占江;;面向对话语料的标签推荐[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 梅放;林鸿飞;;基于社会化标签的移动音乐检索[A];第五届全国信息检索学术会议论文集[C];2009年

4 李静;林鸿飞;;基于用户情感标签的音乐检索算法[A];第六届全国信息检索学术会议论文集[C];2010年

5 骆雄武;万小军;杨建武;吴於茜;;基于后缀树的Web检索结果聚类标签生成方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

6 王波;唐常杰;段磊;尹佳;左R,

本文编号:2309739


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2309739.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1519f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com