当前位置:主页 > 教育论文 > 远程教育论文 >

基于集体智慧的标签推荐系统的设计与开发

发布时间:2017-06-30 22:16

  本文关键词:基于集体智慧的标签推荐系统的设计与开发,,由笔耕文化传播整理发布。


【摘要】:21世纪是网络快速发展的时代,也是用户创造智慧的时代。网络给我们提供了无限多的资源去选择、分享,同时也带来了信息过载的问题,近年来在电子商务领域取得飞速发展的个性化推荐技术是解决这一问题的较好方案。Web2.0时代最大的特征是“以用户为中心”,集体智慧作为这个时代的核心价值观,突出显示了用户的重要性。而社会化标注既是网络环境下集体智慧的典型类型,也是Web2.0时代的标志性应用之一。因此标签为个性化资源推荐带来了新的机遇,其反映了用户对资源的偏好,也是资源特征的关键词描述。 本文主要研究如何在社会性标签系统中使用标签信息对用户进行个性化推荐,主要完成了以下5项工作: (1)介绍了选题背景,突出基于集体智慧的标签推荐系统的设计和开发的必要性和迫切性,同时分析了目前国内外集体智慧和标签推荐系统取得的成就和存在问题,并针对这些问题设计了可行性的实施方案。 (2)介绍了集体智慧、标签系统、标签推荐系统的相关理论,以及协同过滤推荐技术、基于内容的推荐技术和混合推荐技术各自的特点。 (3)依据标签推荐系统功能的要求设计了4种标签推荐算法:PopularTags(系统中最热门的标签推荐算法)、ItemPopularTags(某个资源上最热门的标签推荐算法)、UserPopularTags(用户自己经常使用的标签推荐算法)和TagBaseSIM(改进的基于内容的标签推荐算法)。重点介绍了TagBaseSIM算法,该算法是在传统的基于内容的标签推荐算法上进行的改进,首先利用用户模型和资源模型得到该用户的偏好信息;然后将目标用户标注的所有资源的特征项以及与其相似资源的标签作为候选标签集;同时对候选标签集进行聚类分析,得到各个标签簇和资源的相似度;最后根据相似度的大小向用户推荐N个标签簇中相似度最大的标签列表。由于标签数据自身可能出现标签模糊和冗余,该方法采用标签聚类分析方法(K-means)可以有效降低此问题对于推荐质量的影响。 (4)在数据挖掘平台Sql Server2005和Weka平台上,借助于社会化书签标记系统Delicious真实数据集,采用离线实验方法进行十次十折交叉验证实验,在这些数据集上首先分别对前三个算法进行实验,得到各个个算法的准确率、召回率和综合评价指标F1值;然后对本文提出的改进的基于内容的推荐算法和传统的基于内容推荐方法进行对照实验,结果显示,改进的基于内容的推荐算法具有更好的推荐精度。 (5)在MyEclipse平台上结合MySql数据库管理软件设计开发了针对于“信息技术教师成长发展”这一主题的一个标签推荐系统,该系统在不同的页面中使用了文中提出的四种标签推荐算法,实现向用户推荐不同的标签列表,克服了冷启动的问题。
【关键词】:个性化推荐 集体智慧 标签 标签聚类
【学位授予单位】:陕西师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:G434;TP391.3
【目录】:
  • 摘要3-5
  • Abstract5-10
  • 第1章 绪论10-22
  • 1.1 选题背景10-12
  • 1.1.1 Web 2.0时代和集体智慧10
  • 1.1.2 信息过载10-11
  • 1.1.3 标签的流行11-12
  • 1.2 研究现状12-17
  • 1.2.1 国外研究现状12-15
  • 1.2.2 国内研究现状15-17
  • 1.3 研究方法17-18
  • 1.4 研究目的和意义18-19
  • 1.5 研究内容和结构安排19-22
  • 第2章 相关理论基础和技术介绍22-36
  • 2.1 集体智慧22-24
  • 2.1.1 集体智慧的定义22
  • 2.1.2 集体智慧的特点22-23
  • 2.1.3 集体智慧的原则23
  • 2.1.4 社会认同理论与集体智慧23-24
  • 2.2 标签系统24-30
  • 2.2.1 标签系统24-27
  • 2.2.2 标签系统的基础模型27-28
  • 2.2.3 标签系统的特点28-29
  • 2.2.4 标签系统的作用29-30
  • 2.3 标签推荐系统和推荐技术介绍30-36
  • 2.3.1 标签推荐系统简介30-32
  • 2.3.2 标签推荐系统的分类32
  • 2.3.3 基于协同过滤的标签推荐系统32-34
  • 2.3.4 基于内容的标签推荐系统34-35
  • 2.3.5 基于混合模式的推荐系统35-36
  • 第3章 标签推荐系统的算法设计36-46
  • 3.1 三种简单的标签推荐系统算法37-38
  • 3.1.1 PopularTags37
  • 3.1.2 ItemPopularTags37
  • 3.1.3 UserPopularTags37-38
  • 3.2 改进的基于内容的标签推荐(TagBaseSIM)算法38-46
  • 3.2.1 改进的基于内容的标签推荐算法38-39
  • 3.2.2 用户模型和资源模型39-41
  • 3.2.3 相似度的计算41-42
  • 3.2.4 标签聚类分析42-44
  • 3.2.5 产生推荐结果44-46
  • 第4章 实验设计与结果分析46-60
  • 4.1 实验工具简介46-48
  • 4.1.1 SQL Server 2005简介46-47
  • 4.1.2 Weka平台简介47-48
  • 4.2 实验数据48-50
  • 4.2.1 Delicious数据集简介48-49
  • 4.2.2 Delicious数据集简单分析49-50
  • 4.3 实验评价标准50-52
  • 4.3.1 离线实验50-51
  • 4.3.2 用户调查51-52
  • 4.3.3 在线实验52
  • 4.4 实验设计52-57
  • 4.4.1 实验整体架构设计52-53
  • 4.4.2 聚类分析53-55
  • 4.4.3 训练集和测试集的分割55-56
  • 4.4.4 实验具体设计56-57
  • 4.5 实验结果分析57-60
  • 第5章 标签推荐系统设计与开发60-80
  • 5.1 系统需求分析和总体设计60-64
  • 5.1.1 需求分析60-61
  • 5.1.2 系统功能架构61-62
  • 5.1.3 系统开发环境与技术62-64
  • 5.2 数据库设计64-67
  • 5.2.1 user表64
  • 5.2.2 resource表64-65
  • 5.2.3 Tag表65
  • 5.2.4 UserTaggedRes表65
  • 5.2.5 建立数据库JDBC连接65-67
  • 5.3 系统界面设计67-73
  • 5.3.1 主页面和标签选择页面67-69
  • 5.3.2 用户登录模块设计69-73
  • 5.4 数据管理页面73-74
  • 5.4.1 用户添加标签73-74
  • 5.4.2 添加资源页面74
  • 5.5 系统测试与效果分析74-80
  • 5.5.1 调查问卷设计及完成情况介绍75-76
  • 5.5.2 标签推荐系统用户调查情况分析76-77
  • 5.5.3 用户对标签系统设计情况分析77-78
  • 5.5.4 用户对标签推荐算法情况分析78-79
  • 5.5.5 用户对系统的改进意见情况分析79-80
  • 第6章 总结与展望80-82
  • 6.1 论文总结和主要成果80-81
  • 6.2 进一步的研究和展望81-82
  • 参考文献82-86
  • 附录186-90
  • 附录290-92
  • 致谢92-94
  • 攻读硕士学位期间科研成果94

【参考文献】

中国期刊全文数据库 前3条

1 刘妮;唐慧佳;;Web挖掘在基于标签的个性化推荐中的应用[J];成都信息工程学院学报;2007年04期

2 高凤荣,马文峰,王珊;数字图书馆个性化信息推荐系统研究[J];情报理论与实践;2003年04期

3 甘永成;祝智庭;;虚拟学习社区知识建构和集体智慧发展的学习框架[J];中国电化教育;2006年05期


  本文关键词:基于集体智慧的标签推荐系统的设计与开发,由笔耕文化传播整理发布。



本文编号:503699

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/wangluojiaoyulunwen/503699.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d58f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com