面向社会化媒体的内容推荐若干关键技术研究

发布时间:2017-03-18 02:03

  本文关键词:面向社会化媒体的内容推荐若干关键技术研究,,由笔耕文化传播整理发布。


【摘要】:随着以Web2.0技术为基础的社会化媒体的兴起,个体用户具备了双重角色,既是内容的生产者,又是内容的消费者。社会化媒体逐渐成为人们获取信息、扩展交际的有力工具,同时其影响也逐步扩散到社会、文化、经济和政治等方面,成为信息传播和增值的杠杆。但是由于在社会化媒体中内容呈现规模性、多样性、时效性、幂律特性、爆发性和长尾等特性,导致用户十分容易陷入到内容信息过载、内容价值各异的困境中,从而给用户选择内容、浏览内容造成困扰。传统推荐系统中,通常使用的技术为协同过滤技术,该技术基于已有的用户和项目之间的历史评分,挖掘用户偏好以寻找到偏好相似的邻居用户,以此来进行相应的评分预测和推荐。但是该类算法面临着数据稀疏性、冷启动等问题,造成算法精度不够和覆盖率低。本文以面向社会化媒体推荐为最终目的,研究多场景下如何利用社会化和上下文信息来克服传统推荐技术中的数据稀疏性和冷启动问题,并用于实际的图书馆推荐中。本文研究的场景分为以下四种:只具备用户和物品评分信息、只具备用户行为信息、具备用户物品评分和用户社交关系、具备用户物品评分及物品用户属性。在上述四种场景中分别从基于融合的推荐、基于社区发现的推荐、社区发现与协同过滤结合以及基于上下文信息推荐的四个方面出发,形成从单个推荐技术到多个推荐技术融合,并与实际应用场景相结合的综合推荐引擎。本文主要的创新点为:1)在只具备用户对物品评分数据的场景下,针对社会化媒体中单个协同过滤算法由于噪声较大而无法取得较好的性能和效果的问题,提出两种模型融合方法即建模融合和预测融合,以此对传统的单个协同过滤方法进行融合,两者融合的时间不同,一个是在建模阶段,一个则是在预测阶段。其中建模融合方法将基于邻居协同过滤中的局部相似性和基于模型协同过滤中的全局相似性进行融合,对基于模型协同过滤中的最小化目标函数进行修订;预测融合方法则是将基于多个预测结果的融合问题转换为监督学习问题,从而可以将已有的多种监督学习方法用于其中,该方法首先基于单个预测模型进行预测,然后将多个预测结果通过线性回归(Linear Regreesion, LR)、分箱线性回归 (Binned Linear Regression, BLR)和神经网络(Neural Network,NN)进行融合,以最小化误差值为目标函数,求解相应的模型参数。对实际图书馆数据集的实验结果表明,两种融合方法在图书借阅周期的预测中均较单个传统预测算法更有效果,最好的预测为RSVD-3+RSVD2-3 (NN),其预测的借阅周期误差只有11天,基于此可以制定个性化的图书借阅周期,调整图书库存保证图书资源数量。(第二章,学术论文成果[3])2)在只具备用户行为信息的场景下,针对当前面向社会化媒体的内容推荐中未能较好考虑通过用户行为的群体性发现群体兴趣的问题,提出了基于社区发现的图书推荐算法,该算法基于社区核心的扩张来进行社区发现从而实现内容推荐。基于社区核心的社区发现算法LDK(Local community Detection based on community Kernels),充分考虑具备影响力节点的作用,寻找一定数量且互相不联通的影响力节点作为社区核心,同时在社区发现中采用适应度进行扩张以保证新加入节点与社区核心的紧密度。基于LDK形成了相应的图书推荐方法RoL(Recommendation based on LDK)。基于实际的真实数据仿真结果表明,社区核心的选取大小和个数会对社区发现有一定影响;在基于RoL进行推荐中,RoL因为具备影响力核心社区的作用以及图书流行度时间维度的考虑,RoL(3)较已有的Heats在HR(Hit Rate)指标上平均提升6.58%,在ARHR(Average Reciprocal Hit-Rank)指标上平均提升5.69%,具备较好的实际应用价值。(第三章,学术论文成果[1])3)在具备评分数据和用户社交关系的场景下,针对传统协同过滤算法中未能较好利用社会化关系来解决流行物品对预测的负面影响和数据稀疏性对推荐准确性影响的问题,本文考虑将社会化因素作为重要的考虑因子与现有的评分预测和推荐算法结合,以提升算法的准确性,提出了相应的基于社区发现的邻居协同过滤算法NCFC (Neighborhood Collaborative Filtering based on Community Detection)和基于社区发现的模型协同过滤算法SCR(Socialized-community-based Regularization)。为了在有向加权网络中进行社区发现,对相应的LDK算法在节点影响力评估和适应度函数上进行了修正。NCFC基于社区发现结果来计算用户全局相似度,结合传统的相似度来克服稀疏性问题,该算法可以适用于点击型推荐和连续型评分预测中,其中在点击型推荐中,NCFC在HR上的平均性能较RoL(3)高6.82%,且其性能波动较RoL(3)降低了17.43%,说明NCFC算法的性能高于RoL(3),且具备更好的稳定性;连续型评分预测中,NCFC较ICF在MAE (Mean Absolute Error)和RMSE (Root Mean Square Error)上分别提升3.87%、2.79%。SCR则是通过社区发现对正则邻居做了限定,较已有的ASR(Average-social-based Regularization)在MAE指标方面提升可达5.83%;在RMSE方面性能提升可达6.01%。(第四章,学术论文成果[2,5])4)在具备评分数据和物品用户属性信息的场景下,针对当前推荐算法未能较好利用物品与用户属性上下文信息进行内容推荐的问题,本文充分考虑上下文特征,将上下文特征信息与传统的协同过滤结合,提出了基于上下文的邻居协同过滤算法PLHS (Prediction based on Linear Hybrid Similarity)和CPHS(Cascade Prediction based on Hybrid Similarity),和基于上下文的模型协同过滤算法SLUC(Sparse Linear based on User Context)。其中PLHS和CPHS均将基于评分的相似度和基于上下文的相似度进行合并,然后用于预测和推荐中,CPHS对邻居数进行了一定限定。基于对实际数据集的实验表明,CPHS较已有的RPBC (Rating-personality based Cascade Hybrid Approach)算法在HR指标方面提升了5.4%,在ARHR(上提升了3%。SLUC是对已有算法SLIM (Sparse Linear Method)的拓展,在目标求解函数中添加对用户上下文特征的正则项,并设定相应的正则因子,基于实际数据的仿真表明,该算法较已有的SLIM有更好的性能,在数据集ML100K和图书馆数据集上,SLUC较SLIM在HR和ARHR上都有明显提升。(对第五章,对应学术论文成果[4])
【关键词】:社会化媒体 协同过滤 社会化推荐 社区发现 推荐融合 上下文推荐
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
  • 摘要4-7
  • ABSTRACT7-15
  • 第一章 绪论15-33
  • 1.1 论文研究背景15-23
  • 1.1.1 社会化媒体的现状、分类与发展16-19
  • 1.1.2 社会化媒体内容特征分析19-21
  • 1.1.3 面向社会化媒体的内容推荐研究现状21-23
  • 1.1.4 面向社会化媒体的内容推荐面临的挑战23
  • 1.2 论文研究内容23-24
  • 1.3 论文主要创新点24-26
  • 1.4 攻读博士期间主要工作26-27
  • 1.5 本文的组织结构27
  • 参考文献27-33
  • 第二章 融合的协同过滤推荐33-53
  • 2.1 引言33
  • 2.2 相关研究工作33-35
  • 2.2.1 研究现状33-34
  • 2.2.2 当前研究存在的问题34-35
  • 2.3 已有协同过滤算法35-38
  • 2.3.1 符号表示35
  • 2.3.2 KNNuser35-36
  • 2.3.3 KNNitem36
  • 2.3.4 SVD36-37
  • 2.3.5 算法时间复杂度分析37-38
  • 2.4 协同过滤技术的融合38-43
  • 2.4.1 建模融合38-39
  • 2.4.2 预测融合39-43
  • 2.5 仿真实验分析43-50
  • 2.5.1 仿真场景建立43-45
  • 2.5.2 仿真性能指标45
  • 2.5.3 仿真结果与分析45-50
  • 2.6 本章小结50
  • 参考文献50-53
  • 第三章 基于社区发现的推荐技术研究53-73
  • 3.1 引言53
  • 3.2 相关研究工作53-57
  • 3.2.1 网络中的社区发现53-56
  • 3.2.2 社区发现与推荐56-57
  • 3.2.3 当前研究存在的问题57
  • 3.3 加权用户相似网络的形成57-60
  • 3.3.1 相似度的计算57-58
  • 3.3.2 网络的形成58-60
  • 3.4 基于社区核心的局部化社区发现60-63
  • 3.4.1 算法概述60
  • 3.4.2 社区核心的发现60-62
  • 3.4.3 核心社区的扩张62-63
  • 3.5 基于社区发现的推荐返回63
  • 3.6 相关数据集说明63-65
  • 3.7 仿真实验分析65-68
  • 3.7.1 仿真场景建立65-66
  • 3.7.2 仿真性能指标66
  • 3.7.3 仿真结果与分析66-68
  • 3.8 本章小结68-69
  • 参考文献69-73
  • 第四章 基于社区发现的协同过滤技术的研究73-97
  • 4.1 引言73
  • 4.2 相关研究工作73-77
  • 4.2.1 研究现状73-77
  • 4.2.2 当前研究存在的问题77
  • 4.3 基于社区发现的邻居协同过滤算法77-85
  • 4.3.1 算法整体流程77-78
  • 4.3.2 相似度的计算78
  • 4.3.3 用户相似网络的形成78-79
  • 4.3.4 社区的发现79-81
  • 4.3.5 基于社区的节点全局相似度计算81-82
  • 4.3.6 局部相似度与全局相似度的融合82-83
  • 4.3.7 评分预测和项目推荐83-85
  • 4.4 基于社区发现的模型协同过滤算法85-87
  • 4.4.1 基于社会化社区的正则及参数求解86-87
  • 4.4.2 评分预测87
  • 4.5 仿真实验分析87-92
  • 4.5.1 仿真场景建立87-89
  • 4.5.2 仿真性能指标89
  • 4.5.3 仿真结果与分析89-92
  • 4.6 本章小结92-93
  • 参考文献93-97
  • 第五章 基于上下文信息协同过滤技术的研究97-115
  • 5.1 引言97
  • 5.2 相关研究工作97-100
  • 5.2.1 研究现状97-100
  • 5.2.2 当前研究存在的问题100
  • 5.3 基于上下文的邻居协同过滤算法100-104
  • 5.3.1 算法整体流程100-101
  • 5.3.2 相似度的计算101-103
  • 5.3.3 评分的预测103-104
  • 5.4 基于上下文的模型协同过滤算法104-106
  • 5.4.1 SLIM方法104-105
  • 5.4.2 基于上下文的模型协同过滤105-106
  • 5.5 仿真实验分析106-111
  • 5.5.1 仿真场景建立106-107
  • 5.5.2 仿真结果与分析107-111
  • 5.6 本章小结111
  • 参考文献111-115
  • 第六章 总结和展望115-117
  • 6.1 论文总结115-116
  • 6.2 进一步工作116-117
  • 附录 缩略语117-119
  • 致谢119-120
  • 攻读学位期间发表的学术论文120-121
  • 攻读学位期间参与撰写的标准、研究报告和专利121-122
  • 攻读学位期间参与的科研项目122

【相似文献】

中国期刊全文数据库 前10条

1 宋安;;不要对社会化媒体危机望而却步[J];广告大观(综合版);2011年03期

2 吴剑敏;;社会化媒体在政府中的应用[J];企业导报;2011年08期

3 赵苑君;;社会化媒体的品牌营销[J];信息通信;2011年03期

4 肖瑞;;浅谈社会化媒体的作用[J];教育理论与实践;2011年30期

5 付玉辉;;社会化媒体:未来的确定性和不确定性[J];互联网天地;2011年09期

6 邓煜;唐大麟;于梦;;社会化媒体时代的品牌营销之道[J];现代营销(学苑版);2011年11期

7 ;探寻社会化媒体的价值[J];广告大观(综合版);2012年01期

8 王莉莉;;社会化媒体:广告主的双刃剑[J];广告大观(综合版);2012年01期

9 陈东;;社会化媒体孵化“微博营销公司”?[J];广告大观(综合版);2012年01期

10 杨光;黄玉荣;;社会化媒体对教育的影响[J];科技视界;2012年04期

中国重要会议论文全文数据库 前6条

1 王岚;;利用社会化媒体进行新媒体内容传播[A];中国新闻技术工作者联合会2013年学术年会、五届五次理事会暨第六届“王选新闻科学技术奖”和优秀论文奖颁奖大会论文集(广电篇)[C];2013年

2 吕天鹤;;论社会化媒体对科层制的冲击——以微博为例[A];“传播与中国·复旦论坛”(2013)——网络化关系:新传播与当下中国论文集[C];2013年

3 李艳丽;;社会化媒体在体育产业中的应用现状与发展策略研究[A];2013体育计算机应用论文集[C];2013年

4 华迎;王永贵;李兵;;社会化媒体中用户创造内容(UGC)采纳行为影响因素研究[A];2013中国信息经济学会学术年会暨博士生论坛论文集[C];2013年

5 刘涛;杨有庆;;社会化媒体与都市空间的社会化表征[A];“传播与中国·复旦论坛”(2012)——可沟通城市:理论建构与中国实践论文集[C];2012年

6 信莉丽;庄严;;美联社微博新闻本土化研究[A];2014中国传播论坛:“国际话语体系与国际传播能力建设”研讨会会议论文集[C];2014年

中国重要报纸全文数据库 前10条

1 本报记者 胡海波 编译;社会化媒体:危机公关的利器[N];中国民航报;2011年

2 杨吉;社会化媒体对企业意味着什么[N];上海证券报;2013年

3 杨吉;社会化媒体对企业意味着什么[N];中华读书报;2013年

4 杨吉 法学博士 浙江传媒学院互联网与社会研究中心秘书长;社会化媒体企业意味着什么[N];中国图书商报;2013年

5 本报记者 周婷;社会化媒体掀起营销浪潮[N];中国证券报;2010年

6 祝华新;社会化媒体:社会管理新挑战[N];人民政协报;2011年

7 本报记者 李延生;借力社会化媒体[N];中国企业报;2011年

8 记者 李思;社会化媒体“遍地开花”[N];上海金融报;2011年

9 任沁沁 胡雅婷;梦想成真,社会化媒体正在融入生活[N];新华每日电讯;2012年

10 上海社科院信息研究所知识管理研究中心主任、副研究员 王兴全;“数字化野火”:风险与治理[N];文汇报;2013年

中国博士学位论文全文数据库 前10条

1 赵宇翔;社会化媒体中用户生成内容的动因与激励设计研究[D];南京大学;2011年

2 丁方舟;中国网络行动的动因、过程与影响[D];浙江大学;2015年

3 姚远;面向社会化媒体的用户生成内容推荐技术研究[D];南京大学;2015年

4 朱文龙;社会化媒体调查的适用性与模式效果研究[D];电子科技大学;2014年

5 刘欣;面向社会化媒体的内容推荐若干关键技术研究[D];北京邮电大学;2015年

6 瞿旭晟;互联网平台上的知识生产[D];复旦大学;2010年

7 阴红志;社会化媒体中若干时空相关的推荐问题研究[D];北京大学;2014年

8 田野;基于社会化媒体的话题检测与传播关键问题研究[D];北京邮电大学;2013年

9 李春山;面向社会化媒体内容的若干聚类算法研究[D];哈尔滨工业大学;2014年

10 杨铭;社会化媒体的环境扫描与情报分析[D];哈尔滨工业大学;2012年

中国硕士学位论文全文数据库 前10条

1 庞华;社会化媒体的植入式广告研究[D];郑州大学;2011年

2 游恒振;社会化媒体的演进研究[D];北京邮电大学;2012年

3 许海涛;社会化媒体对我国实体政治的影响及对策分析[D];河北师范大学;2012年

4 宋笛;社会化媒体的信息流研究[D];山东师范大学;2013年

5 朱红燕;试论社会化媒体时代的品牌营销之道[D];苏州大学;2013年

6 郭磊;社会化媒体环境下中小企业营销模式研究[D];北京邮电大学;2012年

7 高灵溪;基于社会化媒体的图书馆阅读推广研究[D];东北师范大学;2013年

8 许璇;移动社会化媒体使用对用户社会资本的影响研究[D];上海外国语大学;2014年

9 卢国祥;霍耐特“承认理论”视域下的社会化媒体研究[D];福建师范大学;2014年

10 于涛;基于社会化媒体的企业内容传播策略研究[D];中国社会科学院研究生院;2015年


  本文关键词:面向社会化媒体的内容推荐若干关键技术研究,由笔耕文化传播整理发布。



本文编号:253752

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/253752.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4fd85***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com