一种基于时间片的微博用户分类方法
本文选题:微博用户分类 切入点:时间片微元 出处:《小型微型计算机系统》2013年11期 论文类型:期刊论文
【摘要】:针对微博用户分类问题提出时间片微元的概念,建立了时间片微元模型;对每个时间片内的微博所涉及到的用户进行研究得到时间片微元内部的用户兴趣度向量,最终整合所有时间片内的用户兴趣度向量,再对整个时间段内用户的兴趣度向量进行两次朴素贝叶斯分类,得到整个时间段内的用户分类.同时,对微博内容研究上规避了传统的单一的依靠系统标签形成用户网络的方式,结合了自然语言处理技术,提取用户兴趣方向,形成用户兴趣向量,然后对用户兴趣向量分析,采用改进的朴素贝叶斯分类算法进行用户分类.最后是对所提出的方法按详细步骤进行实验,研究结果表明,基于时间片的微博用户分类方法能有效对大规模的微博语料中所涉及到的用户进行较准确分类,为研究微博用户分类问题具有一定推动作用.
[Abstract]:According to Weibo user classification problem, the concept of time slice microelement is put forward, and the time slice microelement model is established, and the user interest vector inside the time slice microelement is obtained by studying the user involved in each time slice. Finally, the user interest vector of all time slices is integrated, and then the user interest vector of the whole time period is classified twice by naive Bayes, and the user classification in the whole time period is obtained. At the same time, Weibo content research evades the traditional single way of forming user network based on system tags, combines natural language processing technology, extracts user interest direction, forms user interest vector, and then analyzes user interest vector. The improved naive Bayesian classification algorithm is used to classify users. Finally, the experimental results show that the proposed method is based on detailed steps. Weibo user classification method based on time slice can effectively classify the users involved in the large-scale Weibo corpus, and it has a certain role in promoting the research on the user classification problem of Weibo.
【作者单位】: 武汉大学计算机学院;徐州工业职业技术学院信息管理技术学院;武汉大学软件工程国家重点实验室;
【基金】:国家自然科学基金项目(61070083)资助
【分类号】:TP393.092
【参考文献】
相关期刊论文 前2条
1 王晓光;;微博客用户行为特征与关系特征实证分析——以“新浪微博”为例[J];图书情报工作;2010年14期
2 方锦清;汪小帆;郑志刚;;非线性网络的动力学复杂性研究[J];物理学进展;2009年01期
【共引文献】
相关期刊论文 前10条
1 杨学成;隋越;岳欣;;机构微博的社会关系网络构建——以腾讯商学院为例[J];北京邮电大学学报(社会科学版);2012年03期
2 方锦清;汪小帆;郑志刚;;非线性网络的动力学复杂性的研究[J];复杂系统与复杂性科学;2010年Z1期
3 祝方林;;大学图书馆微博信息行为分析[J];高校图书情报论坛;2012年02期
4 朱陈平;张永梅;刘小廷;王荣芳;王新光;;复杂网络稀疏性的统计物理研究综述[J];上海理工大学学报;2011年05期
5 张航;;大学生高频率转发微博的行为分析与思考[J];经济研究导刊;2012年12期
6 黄映玲;;微博传播机制及其在教育中的有效应用分析[J];中国教育信息化;2011年08期
7 肖宇;许炜;商召玺;;微博用户区域影响力识别算法及分析[J];计算机科学;2012年09期
8 何黎;何跃;霍叶青;;微博用户特征分析和核心用户挖掘[J];情报理论与实践;2011年11期
9 王晓光;袁毅;滕思琦;;微博社区交流网络结构的实证分析[J];情报杂志;2011年02期
10 李燕萍;;微博比较研究[J];情报杂志;2012年03期
相关会议论文 前1条
1 方锦清;;核科技领域的复杂网络研究概述与发展前景[A];中国核科学技术进展报告——中国核学会2009年学术年会论文集(第一卷·第6册)[C];2009年
相关博士学位论文 前10条
1 谭婷婷;网络微内容推荐方法及支持系统研究[D];华中科技大学;2011年
2 邓小龙;基于复杂网络分析的新一代电信CRM关键技术研究[D];北京邮电大学;2011年
3 刘为凯;复杂多智能体网络的协调控制及优化研究[D];华中科技大学;2011年
4 胡海波;在线社会网络的结构、演化及动力学研究[D];上海交通大学;2010年
5 易兰丽;基于人类动力学的微博用户行为统计特征分析与建模研究[D];北京邮电大学;2012年
6 肖宇;校园网络信息传播特性与用户影响力研究[D];华中科技大学;2012年
7 路兰;基于复杂网络的财富分布与财富演化分析[D];青岛大学;2013年
8 田占伟;基于复杂网络的微博信息传播研究[D];哈尔滨工业大学;2012年
9 王慧贤;社交网络媒体平台用户参与激励机制研究[D];北京邮电大学;2013年
10 郭龙飞;社交网络用户隐私关注动态影响因素及行为规律研究[D];北京邮电大学;2013年
相关硕士学位论文 前10条
1 许玉;基于微博的网络口碑研究[D];南京大学;2011年
2 张岚岚;新浪微博的网络舆情分析研究[D];华东师范大学;2011年
3 史亚光;企业微博客营销策略研究[D];华东师范大学;2011年
4 纪珊珊;传播学视野下的微博研究[D];安徽大学;2011年
5 邵国川;基于用户参与的高校图书馆信息服务研究[D];安徽大学;2011年
6 施怿;微博在危机事件中的传播特点和效果研究[D];华中科技大学;2011年
7 陆毅;微博社会网络构造与分析技术研究[D];复旦大学;2011年
8 贺佳莹;微博客用户接受模型及实证研究[D];北京邮电大学;2012年
9 杨艳;下一代网络业务用户行为研究[D];西南交通大学;2012年
10 陈晓明;企业微博客营销效果的影响因素分析[D];暨南大学;2012年
【二级参考文献】
相关期刊论文 前10条
1 丁楠;潘有能;;h指数和g指数评价实证研究——基于CSSCI的统计分析[J];图书与情报;2008年02期
2 李华;赵文伟;;微博客:图书馆的下一个网络新贵工具[J];图书与情报;2009年04期
3 胡海波;王科;徐玲;汪小帆;;基于复杂网络理论的在线社会网络分析[J];复杂系统与复杂性科学;2008年02期
4 李永;方锦清;刘强;张茉楠;陈宏斌;;我国高技术产业网络的相关特性探讨[J];上海理工大学学报;2008年03期
5 张荣;白龙;翁甲强;方锦清;;均匀聚焦磁场中束晕-混沌的孤子控制[J];计算物理;2007年03期
6 许丹;李翔;汪小帆;;局域世界复杂网络中的病毒传播及其免疫控制[J];控制与决策;2006年07期
7 姚长青;乔晓东;张连均;王子祥;;基于NSTL原文索取数量的空间自相关性分析[J];情报科学;2009年10期
8 余海军;白龙;翁甲强;罗晓曙;方锦清;;周期聚焦磁场中束晕-混沌的实Morlet小波函数控制(英文)[J];强激光与粒子束;2008年06期
9 方锦清;;从网络科学发展观考察多层次的高科技企业网络[J];世界科技研究与发展;2008年05期
10 廖高华,翁甲强,成丽春,方锦清;束晕-混沌控制中的粒子跟踪模拟研究[J];物理学报;2005年01期
,本文编号:1641498
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1641498.html