当前位置:主页 > 管理论文 > 移动网络论文 >

微博中个人与非个人用户分类方法研究

发布时间:2017-07-02 20:32

  本文关键词:微博中个人与非个人用户分类方法研究


  更多相关文章: 个人用户识别 新浪微博 文本分类 自然语言处理 社交网络


【摘要】:分别利用用户名和微博文本对个人与非个人两种用户类型进行判别,并对不同的特征(例如:字特征、词特征等)进行研究分析;其次,在针对用户名和微博文本的两个分类器的基础上,使用贝叶斯融合方法进行分类器融合,充分利用两种文本分类信息同时进行用户类型判断。实验结果表明此方法可以达到较高的识别准确率,并且分类器融合方法明显优于仅利用用户名或者微博文本的分类方法。
【作者单位】: 苏州大学自然语言处理实验室;海军驻河海大学选培办;
【关键词】个人用户识别 新浪微博 文本分类 自然语言处理 社交网络
【基金】:国家自然科学基金(61375073)
【分类号】:TP393.092;TP391.1
【正文快照】: 0引言随着Web2.0的出现及迅速发展,社交网站的概念越来越深入人心。各种类型的微型博客(Microblog)即微博相继产生,成为一个跨时代的产品。一般而言,微博是一个基于用户关系的信息获取、传播及分享的交流平台,注册用户可以通过SMS、电邮、网站或第三方应用在微博网站上面发布

【参考文献】

中国期刊全文数据库 前8条

1 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期

2 曹波;苏一丹;邓琦;;基于最大熵模型的中国人名自动识别[J];计算机工程与应用;2009年04期

3 郑家恒,张辉;基于HMM的中国组织机构名自动识别[J];计算机应用;2002年11期

4 孙茂松,黄昌宁,高海燕,,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期

5 张剑峰;夏云庆;姚建民;;微博文本处理研究综述[J];中文信息学报;2012年04期

6 文坤梅;徐帅;李瑞轩;辜希武;李玉华;;微博及中文微博信息处理研究综述[J];中文信息学报;2012年06期

7 马俊;周刚;许斌;黄永忠;;基于个人属性特征的微博用户影响力分析[J];计算机应用研究;2013年08期

8 李泽魁;赵妍妍;秦兵;刘挺;;中文微博情感倾向性分析特征工程[J];山西大学学报(自然科学版);2014年04期

【共引文献】

中国期刊全文数据库 前10条

1 李玉森;张雪英;袁正午;;面向GIS的地理命名实体识别研究[J];重庆邮电大学学报(自然科学版);2008年06期

2 史永刚;左志宏;;决策树在中文姓名信息提取中的应用研究[J];成都信息工程学院学报;2006年02期

3 窦嵘;加羊吉;黄伟;;统计与规则相结合的藏文人名自动识别研究[J];长春工程学院学报(自然科学版);2010年02期

4 李建平;王慧强;卢爱平;郝洪亮;冯光升;;基于条件随机场的网络安全态势量化感知方法[J];传感器与微系统;2010年10期

5 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];国外语言学;1996年04期

6 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期

7 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期

8 黄德根;李泽中;万如;;基于SVM和CRF的双层模型中文机构名识别[J];大连理工大学学报;2010年05期

9 刘利东;信息源中专业词语的提取方法[J];德州学院学报(自然科学版);2002年02期

10 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报(自然科学版);2003年02期

中国重要会议论文全文数据库 前10条

1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 何正焱;王厚峰;;商品品牌名称挖掘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年

4 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年

5 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年

6 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年

7 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

8 季Y

本文编号:511174


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/511174.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户76bd1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com