当前位置:主页 > 管理论文 > 移动网络论文 >

中文微博用户性别分类方法研究

发布时间:2017-06-23 07:09

  本文关键词:中文微博用户性别分类方法研究,由笔耕文化传播整理发布。


【摘要】:该文旨在研究中文微博用户的性别分类问题,即根据微博提供的中文文本信息对注册用户的性别进行识别。虽然基于微博的性别分类已经有一定研究,但是针对中文的性别分类工作还很缺乏。该文首先提出分别利用用户名和微博文本构建两个分类器对用户的性别类型进行判别,并对不同的特征(例如,字特征、词特征等)进行了研究分析;其次,在针对用户名和微博文本的两个分类器的基础上,使用贝叶斯融合方法进行分类器融合,从而达到采用这两种文本分类信息同时对用户性别进行性别判断。实验结果表明该文的方法可以达到较高的识别准确率,并且分类器融合的方法明显优于仅利用用户名或者微博文本的分类方法。
【作者单位】: 苏州大学计算机科学与技术学院自然语言处理实验室;
【关键词】性别分类 新浪微博 文本分类 社交网络
【基金】:国家自然科学基金(61375073)
【分类号】:TP391.1;TP393.092
【正文快照】: 1引言近几年来,随着社交网络的迅猛发展,各种类型的微博即微型博客(Microblog)备受用户的青睐,例如,Twitter、Facebook等。新浪微博是国内知名的微博网站,截止到2012年12月,新浪微博注册用户突破5.03亿,用户每日发博量超过1亿条。由于微博既具有媒体传播特性,又具有社交网络特

【参考文献】

中国期刊全文数据库 前1条

1 张剑峰;夏云庆;姚建民;;微博文本处理研究综述[J];中文信息学报;2012年04期

【共引文献】

中国期刊全文数据库 前10条

1 饶洁;;基于内容的移动社交网络审计分析引擎[J];电脑知识与技术;2014年10期

2 杨海;;基于微博的网络舆情监测系统的研究[J];科技致富向导;2013年30期

3 阳爱民;林江豪;周咏梅;;中文文本情感词典构建方法[J];计算机科学与探索;2013年11期

4 施询之;孙宁远;李骋罡;;基于微博信息库和文本分词的人机对话模型设计[J];计算机与现代化;2013年11期

5 高俊波;梅波;;基于文本内容分析的微博广告过滤模型研究[J];计算机工程;2014年05期

6 张辉;刘奕群;马少平;;文本情感分类中生成式情感模型的发展[J];计算机应用研究;2014年12期

7 王萌;张红英;田娜;严大虎;;基于信息挖掘技术的大学生微博行为研究[J];中国信息技术教育;2014年23期

8 王连喜;;微博短文本预处理及学习研究综述[J];图书情报工作;2013年11期

9 李纲;陈t熀,

本文编号:474241


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/474241.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dddd3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com