社交网络中的用户转发行为预测
本文关键词: 社交网络 微博 转发行为 出处:《上海交通大学学报》2013年04期 论文类型:期刊论文
【摘要】:以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.
[Abstract]:Taking Weibo of Sina as the research object, this paper proposes a prediction algorithm of user forwarding behavior in social networks based on the theme and user characteristics of Weibo. Firstly, based on the theory of mutual information, features are extracted from the content of the user whose forwarding behavior has taken place. By analyzing the correlation between Weibo's content and features of a given user, the author predicts whether the user will forward the user to Weibo on a given theme, and then studies the user's gender, number of followers, and number of concerns. The relationship between Weibo number and user forwarding behavior, selecting appropriate user feature description, and predicting the forwarding probability of given user to Weibo based on Bayesian model. Finally, combined with the prediction results of the above two algorithms, The prediction of the forwarding behavior of a given user to a certain subject Weibo is obtained. The prediction algorithm is of great significance to the study of network public opinion dissemination and Weibo marketing.
【作者单位】: 上海交通大学信息安全工程学院;
【基金】:国家自然科学基金资助项目(61171173,61272441) 国家高技术研究发展计划(863)项目(2010AA012505)
【分类号】:TP393.092
【参考文献】
相关期刊论文 前3条
1 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
2 王洁;汤小春;;基于社区网络内容的个性化推荐算法研究[J];计算机应用研究;2011年04期
3 蔡巍,王永成,李伟,尹中航;三种分类算法的实验比较[J];上海交通大学学报;2004年04期
【共引文献】
相关期刊论文 前10条
1 张璇;左敏;;一种改进的朴素贝叶斯分类器在文本分类中的应用研究[J];北京工商大学学报(自然科学版);2009年04期
2 薛松;张钟澍;殷知磊;;贝叶斯算法在反垃圾邮件应用中的改进方案[J];成都信息工程学院学报;2009年04期
3 叶飞;;基于文本语义联系的特征选取算法研究[J];赤峰学院学报(自然科学版);2012年12期
4 孙铁利;张妍;李晓微;;文本挖掘中特征降维方法比较研究[J];电脑知识与技术;2008年02期
5 张晶;;关于过滤垃圾短信方法的研究[J];电脑知识与技术;2008年23期
6 邱云飞;邵良杉;那宝贵;;面向合作伙伴选择的中文Web信息获取系统研究[J];电子商务;2010年07期
7 陈光;;优化K-近邻方法及其应用[J];福建电脑;2009年02期
8 李永健;王斌君;;垃圾短信过滤中的特征降维算法比较[J];中国人民公安大学学报(自然科学版);2008年03期
9 姚学礼;;文本分类中的特征提取方法的研究[J];光盘技术;2009年06期
10 苑俊英;袁方;刘博;;一种基于类别核心词的概念映射方法[J];广西师范大学学报(自然科学版);2007年02期
相关会议论文 前5条
1 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
2 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十二届中国(天津)'2008IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2008年
3 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
4 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 李月伦;李湘;常宝宝;袁毓林;;一种基于认知情景框架的文本分类方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
相关博士学位论文 前10条
1 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
2 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
4 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
5 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
6 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
7 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
8 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
9 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
10 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
相关硕士学位论文 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
4 孙海虹;基于模糊粗糙集的Web文本分类研究[D];哈尔滨理工大学;2010年
5 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年
6 曹亚辉;非结构文本最佳近似匹配系统的研究与实现[D];东华大学;2011年
7 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
8 柴智;基于UIMA的数据库监控文档解析[D];吉林大学;2011年
9 邓彩凤;中文文本分类中互信息特征选择方法研究[D];西南大学;2011年
10 赵娟娟;基于特征聚类的文本分类算法研究[D];华南理工大学;2011年
【二级参考文献】
相关期刊论文 前4条
1 刁倩,王永成,张惠惠,何骥;文本自动分类中的词权重与分类算法[J];中文信息学报;2000年03期
2 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
3 尹中航,王永成,蔡巍,韩客松;利用串匹配技术实现网上新闻的主题提取(英文)[J];软件学报;2002年02期
4 曾春,邢春晓,周立柱;个性化服务技术综述[J];软件学报;2002年10期
相关硕士学位论文 前1条
1 刘耀庭;社交网络结构研究[D];浙江大学;2008年
【相似文献】
相关期刊论文 前10条
1 王艳;;Twitter技术及其在情景教育中的应用[J];中国西部科技;2010年16期
2 崔争艳;;基于语义的微博短信息分类[J];现代计算机(专业版);2010年08期
3 王鼎云;;对微博的发展状况和趋势的冷思考[J];时代教育(教育教学);2011年01期
4 李士奇;;微博使用者应具备的基本素养[J];科教导刊(上旬刊);2011年03期
5 刘颖录;;浅析新网络时代的微博传播[J];商业文化(上半月);2011年05期
6 张来勇;;浅析移动互联网技术的教育应用[J];中国信息技术教育;2011年Z1期
7 申诗逸;;论“微博”的传播特点与推广[J];青年文学家;2010年14期
8 揭潇君;;浅析动漫作品在微博平台的传播[J];数字技术与应用;2010年11期
9 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
10 王淑敏;李军豪;;蜜罐技术在社交网络反垃圾信息中应用[J];煤炭技术;2011年07期
相关会议论文 前4条
1 郭鹏;陈s,
本文编号:1529356
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1529356.html