基于兴趣标签的缄默用户性别预测研究
发布时间:2018-01-07 13:10
本文关键词:基于兴趣标签的缄默用户性别预测研究 出处:《华中科技大学学报(自然科学版)》2015年12期 论文类型:期刊论文
更多相关文章: 数据挖掘 性别预测 缄默用户 兴趣标签 概念类
【摘要】:为解决社交媒体中缄默用户的性别预测问题,提出利用用户文件夹中的兴趣标签进行区分的方法.针对标签存在稀疏和歧义性的特点,设计了一种基于概念类推断用户性别的框架.首先依据社交心理特征将标签划分为若干概念类;其次通过关联挖掘方法扩充概念类;最后通过概念类压缩用户特征空间.在新浪微博真实数据集上进行验证,实验结果表明:所提方法对于缄默用户性别有显著的区分效果,在不使用任何微博信息的条件下,区分准确率达到71%.
[Abstract]:In order to solve the tacit social media users in the gender prediction problem, put forward to distinguish the method using user folder in tag. According to the characteristics of the label has been sparse and ambiguous, is designed based on the concept of a class inference framework. Firstly based on the gender feature label heart agency is divided into several concepts; the second method expand the concept class through association mining; finally, the concept of compressed feature space. To verify the user in Sina micro-blog real datasets. The experimental results show that the proposed method has a significant effect on gender distinction in silence, do not use any micro-blog information, distinguish the accuracy rate of 71%.
【作者单位】: 武汉大学软件工程国家重点实验室;
【基金】:国家自然科学基金资助项目(61272275,61232002,61202036,61272110)
【分类号】:TP311.13;TP393.092
【正文快照】: 随着社交媒体的普及,用户肖像在近几年引起了大量研究者的研究兴趣[1-3].用户肖像用于预测一个用户的人口特征,例如年龄、性别、职业、教育和政治倾向等.其中性别作为最重要的特征,引发了大量的研究关注[4-7].现有方法主要依赖文本内容来建立特征向量,然而许多社交媒体中,用户,
本文编号:1392678
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1392678.html