一种面向企业的行业微博信息推荐方法
【图文】:
86计算机应用与软件2014年图12012年2月新浪企业微博行业分布虽然微博平台包含了各种行业信息,而且对于行业事件的反应很快,但是在其上获取较为全面的行业信息面临诸多困难。微博平台的兴起和用户的快速增长带来了信息过载问题,随着用户关注数量的增加,与行业无关的内容也越来越多地出现在用户订阅的微博中。加之微博平台本身也具有主题分散和信息碎片化的特点。这就要求能够识别企业微博用户的行业兴趣,并对微博信息依照行业相关度进行提取和推荐。然而,现有的社交媒体管理与分析软件在行业信息提取方面大多仅仅利用用户自定义关键词来进行简单的文字匹配,这种方法存在较大缺陷。首先,个别关键词并不能全面刻画行业信息需求;其次,语言的丰富性使得简单的文字匹配效果很受限。本文针对以上问题提出了一种基于行业语料的行业信息推荐方法。行业语料的来源方面,由于企业微博所发信息具有较强的行业相关性,所以行业相关用户的历史微博是行业语料的主要来源。对行业语料采用关键词提取和用户自定义关键词扩展技术相融合的方法建模用户的行业兴趣,从而兼顾了行业信息的全面刻画与用户兴趣的动态改变。最后,通过比较行业兴趣与待过滤微博的相关性来提取和推荐行业相关微博信息。1相关工作微博等社交媒体促使了学术界一个新兴的研究分支———社交媒体分析SMA(SocialMediaAnalytics)的兴起。Melville等人提出了SMA需要解决的四大关键问题[7],即相关挖掘、影响力识别、情感分析和话题检测,Leskovec又将SMA的问题进一步细化[8]。在国内,基于微博的研究工作近年来也获得了越来越多的关注。文坤梅等人对基于中文微博的研究工作进行了综述[9]。在国内,计算机学科内关于社交媒体分析的相关研究刚刚起步,相关研
保囝没ё远ㄒ骞丶憧誓芄辉谝欢ǔ潭壬辖饩隼?启动现象。本方法主要分为数据获取与预处理、行业关键词提娶用户自定义关键词扩展以及个性化微博推荐四大组成部分。首先,获取用户相关微博信息进行数据预处理;之后数据分别交由关键词提取与关键词扩展模块,关键词提取将基于TextRank算法无指导地进行,关键词扩展将基于用户自定义关键词使用P-IOW算法进行;之后将二者的结果根据用户自定义权重进行线性合并;合并结果供相关推荐模块进行相关度比较,以对待推荐微博生成相关性评分,从而达到推荐相关微博的目的。处理流程如图2所示。图2方法整体流程图示2.1数据获取与预处理本文基于行业相关语料进行关键词提取与关键词扩展。行业相关语料的来源可以是该用户的历史微博语料,也可以是用户指定的若干个本行业相关企业用户的历史微博语料。在经过对若干行业微博的分析后,本文发现名词能够较准
【参考文献】
相关期刊论文 前5条
1 宋双永;李秋丹;;面向移动终端的微博信息推荐方法[J];计算机科学;2011年11期
2 文坤梅;徐帅;李瑞轩;辜希武;李玉华;;微博及中文微博信息处理研究综述[J];中文信息学报;2012年06期
3 程亮;邱云飞;孙鲁;;微博谣言检测方法研究[J];计算机应用与软件;2013年02期
4 李莹;;对于企业微博营销的发展现状与展望[J];价值工程;2012年31期
5 赵春芳;;浅谈中小企业如何走出微博营销困境[J];现代商业;2012年21期
【共引文献】
相关期刊论文 前10条
1 马宁;刘怡君;;基于超网络中超边排序算法的网络舆论领袖识别[J];系统工程;2013年09期
2 刘喜文;郑昌兴;王文龙;汤刚强;;构建数据仓库过程中的数据清洗研究[J];图书与情报;2013年05期
3 季芳;;中小企业实施微博营销策略分析[J];四川职业技术学院学报;2013年05期
4 马宝君;张楠;孙涛;;智慧城市背景下公众反馈大数据分析:概率主题建模的视角[J];电子政务;2013年12期
5 潘善亮;茅琴娇;韩露;;一种基于虚拟社交化的Web服务发现方法研究[J];电信科学;2013年12期
6 易军凯;田立康;;基于类别区分度的文本特征选择算法研究[J];北京化工大学学报(自然科学版);2013年S1期
7 代宽;赵辉;韩冬;宋天勇;;基于向量空间模型的中文网页主题特征项抽取[J];吉林大学学报(信息科学版);2014年01期
8 顾益军;解易;张培晶;;面向有组织犯罪分析的人际关系网络节点重要性评价研究[J];中国人民公安大学学报(自然科学版);2013年04期
9 吴瑞红;吕学强;;基于互联网的术语定义辨析[J];北京大学学报(自然科学版);2014年01期
10 罗琦;;一种最大分类间隔SVDD的多类文本分类算法[J];电讯技术;2014年04期
相关会议论文 前1条
1 刘权;郭武;;基于核主成分分析的话题跟踪系统[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
相关博士学位论文 前10条
1 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年
2 马飞;云数据中心中虚拟机放置和实时迁移研究[D];北京交通大学;2013年
3 乐承毅;企业知识与员工知识贡献度集成评价方法及应用研究[D];浙江大学;2013年
4 孙甲申;基于主题模型和随机游走的标签技术研究[D];北京邮电大学;2013年
5 张鹏;数据中心网络的流量管理和优化问题研究[D];北京邮电大学;2013年
6 王宝勋;面向网络社区问答对的语义挖掘研究[D];哈尔滨工业大学;2013年
7 龚书;抽取式多文档文摘的文本表示研究[D];北京交通大学;2013年
8 张俊三;Web中相关实体发现研究[D];北京交通大学;2013年
9 尹莉;基础数学领域作者合作网络实证分析[D];西北大学;2013年
10 李朋;异构信息网络分析模型及其应用研究[D];重庆大学;2013年
相关硕士学位论文 前10条
1 高雅;微博新闻事件信息可信度评价[D];吉林大学;2013年
2 耿玉娇;MapReduce中基于抽样技术的倾斜问题研究[D];大连海事大学;2013年
3 芮虎;比价购物平台中网络爬虫的设计与实现[D];华东理工大学;2013年
4 王梓;林产品贸易信息用户兴趣模型及个性化搜索[D];北京林业大学;2013年
5 牛雷;分布式多媒体平台中视频搜索技术的研究与应用[D];北京邮电大学;2013年
6 胡莹;移动微博持续使用行为影响因素研究[D];北京邮电大学;2013年
7 林哲;面向行业的信息融合原型系统的研究与实现[D];北京邮电大学;2013年
8 万德稳;藏文搜索和搜索结果聚类研究及系统实现[D];西南交通大学;2013年
9 阎正喜;H基金公司网上交易系统安全问题研究[D];西南交通大学;2013年
10 陈彦敏;基于联合条件熵的文本特征提取算法的研究及其应用[D];华东师范大学;2013年
【二级参考文献】
相关期刊论文 前10条
1 闫瑞;曹先彬;李凯;;面向短文本的动态组合分类算法[J];电子学报;2009年05期
2 廖祥文;曹冬林;方滨兴;许洪波;程学旗;;基于概率推理模型的博客倾向性检索研究[J];计算机研究与发展;2009年09期
3 杜伟夫;谭松波;云晓春;程学旗;;一种新的情感词汇语义倾向计算方法[J];计算机研究与发展;2009年10期
4 何菲;;微博营销第N种可能——超越粉丝[J];IT经理世界;2011年09期
5 郑斐然;苗夺谦;张志飞;高灿;;一种中文微博新闻话题检测的方法[J];计算机科学;2012年01期
6 陈可,张琴舜,陈培培,蔡日基;BP神经网络在证券分析预测中应用[J];计算机工程;2001年11期
7 林小俊;张猛;暴筱;李军;吴玺宏;;基于概念网络的短文本分类方法[J];计算机工程;2010年21期
8 许晓东;肖银涛;朱士瑞;;微博社区的谣言传播仿真研究[J];计算机工程;2011年10期
9 李文波;孙乐;张大鲲;;基于Labeled-LDA模型的文本分类新算法[J];计算机学报;2008年04期
10 曹娟;张勇东;李锦涛;唐胜;;一种基于密度的自适应最优LDA模型选择方法[J];计算机学报;2008年10期
,本文编号:2584637
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2584637.html