多阶信息模型及推荐技术研究

发布时间:2017-05-30 07:10

  本文关键词:多阶信息模型及推荐技术研究,由笔耕文化传播整理发布。


【摘要】:社区结构刻画了网络中边连接关系的局部聚集特性,网络中的社区通常由功能相近或性质相似的网络节点所组成,发现网络中的社区结构有助于揭示网络结构和功能之间的关系。早前网络社区发现的研究主要集中在博客、邮件等媒体,近几年随着web2.0的发展,诸如Facebook,twitter,微博、人人网等SNS积累了大量的用户数据,发现SNS中的用户社区结构极具商业价值,也吸引了大量的研究者研究其网络社区结构,但这些研究大多基于单一的数据源信息构建模型,大量的可利用的数据没有得到利用。本文利用从新浪微博抓取的数据,基于模块度最大化思想,结合好友关系、地理位置和兴趣标签的多阶情境信息,使用张量分解的思想将多阶情境信息降维,采用谱聚类方法寻找社区结构信息。最后利用聚类系数评估聚类质量,并采用单一信息源发现社区结构算法与本文算法做对比实验评估本文综合多阶情境信息发现社区结构模型质量。当前主流的协同推荐技术有基于用户、基于项目和基于用户项目的协同推荐技术;随着移动互联网的发展,以及用户兴趣漂移等原因,用户的兴趣标签、地理位置数据成为推荐技术研究中的一项新的重要因子,实现结合好友关系、标签信息和地理位置数据的的个性化推荐具有重要的意义。传统的协同推荐技术无法很好解决大众标注数据推荐中所面临的标签语义和数据稀疏性问题,本文综合利用多维信息获得的社团聚类、用户兴趣标签和标签主题构造原始张量,并使用高阶奇异值分解方法找出推荐结果,实验采用结合召回率和准确率的F值进行评估。
【关键词】:社区结构 社区发现 推荐技术 模块度最大化 高阶奇异值分解
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
  • 摘要5-6
  • Abstract6-11
  • 第1章 绪论11-21
  • 1.1 研究背景和意义11-13
  • 1.1.1 研究背景11-12
  • 1.1.2 研究意义12-13
  • 1.2 研究现状及趋势13-16
  • 1.2.1 社区发现研究概况13-14
  • 1.2.2 推荐系统研究概况14-16
  • 1.3 研究目标及内容16-18
  • 1.4 论文组织结构18-19
  • 1.5 论文符号及说明19
  • 1.6 本章小结19-21
  • 第2章 相关理论及说明21-34
  • 2.1 发现社区结构研究21-28
  • 2.1.1 社会网络结构21-23
  • 2.1.2 社区结构发现算法23-25
  • 2.1.3 社区结构的评价测度25-28
  • 2.2 推荐技术相关研究28-31
  • 2.2.1 推荐算法研究28-30
  • 2.2.2 推荐质量测度30-31
  • 2.3 潜在狄利克雷分配31-33
  • 2.4 本章小结33-34
  • 第3章 数据预处理34-49
  • 3.1 微博用户数据特征34-35
  • 3.2 模块化矩阵35-36
  • 3.3 用户关注数据处理36-41
  • 3.3.1 微博用户关注关系说明36-37
  • 3.3.2 基于关注关系的用户相似度计算37-41
  • 3.4 用户兴趣数据处理41-48
  • 3.4.1 兴趣标签数据分析41-42
  • 3.4.2 分词及词语扩展42-43
  • 3.4.3 抽取兴趣主题43-46
  • 3.4.5 基于标签信息的用户相似度计算46-48
  • 3.5 用户地理位置数据处理48
  • 3.6 本章小结48-49
  • 第4章 基于模块度最大化思想结合多维数据发现社区结构49-63
  • 4.1 社区发现49-50
  • 4.2 发现社区算法及设计50-56
  • 4.2.1 模块度最大化50-53
  • 4.2.2 多维信息源的社区聚类53-56
  • 4.3 实验结果及分析56-62
  • 4.3.1 实验实施56-59
  • 4.3.2 评估标准59-60
  • 4.3.3 实验方案及结果分析60-62
  • 4.4 本章小结62-63
  • 第5章 基于用户聚类社团和高阶奇异值分解的标签推荐63-72
  • 5.1 大众标注63-65
  • 5.2 推荐模型及设计65-69
  • 5.2.1 奇异值分解65-66
  • 5.2.2 张量分解建模66-69
  • 5.3 实验及结果分析69-71
  • 5.3.1 数据集69
  • 5.3.2 评估标准69-70
  • 5.3.3 实验方案及结果分析70-71
  • 5.4 本章小结71-72
  • 第6章 总结及展望72-74
  • 6.1 全文总结72-73
  • 6.2 展望73-74
  • 参考文献74-79
  • 致谢79

【参考文献】

中国期刊全文数据库 前10条

1 马柏樟;颜志军;;基于潜在狄利特雷分布模型的网络评论产品特征抽取方法[J];计算机集成制造系统;2014年01期

2 闫光辉;舒昕;马志程;李祥;;基于主题和链接分析的微博社区发现算法[J];计算机应用研究;2013年07期

3 孙玲芳;李烁朋;;基于K-means聚类与张量分解的社会化标签推荐系统研究[J];江苏科技大学学报(自然科学版);2012年06期

4 袁园;孙霄凌;朱庆华;;微博用户关注兴趣的社会网络分析[J];现代图书情报技术;2012年02期

5 杨博;赵鹏飞;;推荐算法综述[J];山西大学学报(自然科学版);2011年03期

6 李实;叶强;李一军;罗嗣卿;;挖掘中文网络客户评论的产品特征及情感倾向[J];计算机应用研究;2010年08期

7 高e,

本文编号:406623


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/406623.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e1650***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com