当前位置:主页 > 管理论文 > 移动网络论文 >

基于社交网络的数据过滤与数据推送

发布时间:2017-05-29 02:03

  本文关键词:基于社交网络的数据过滤与数据推送,由笔耕文化传播整理发布。


【摘要】:随着Web2.0时代的到来,各类网络技术迅猛发展,计算机模拟人类思维能力不断提高,各类工业和生活应用大量涌现。这也导致了庞大的历史数据堆积,人类已经从信息匮乏时代过渡到信息过载时代。面对巨大的、无序的Internet空间,传统的信息搜索方式已经不能满足人们日益增长的信息需求。如何利用计算机从海量数据中快速高效地找出潜在的、有价值的信息,成为了人们关注的热点话题。目前,推荐系统的发展能帮助用户方便、快捷地定位所需信息,而对用户进行兴趣分析正是其中的关键。社交网络的迅速崛起为我们分析用户兴趣提供了一个崭新的内容全面且丰富的数据来源。因此,社交网络成为了当前国内外学者研究的重要内容。另外,在过去的一段时间里,信息处理技术不断走向成熟。其中文本相似性计算也有了长足的发展,被广泛应用于文献检索、文本分类和机器翻译等领域。一些学者对中文文本分词方法、特征值提取方法和文本相似性判别算法进行改进,并取得了一定成果。但是这些方法大都是针对特定领域的具体应用而言,适用范围较小。受中文语言特点的限制,现有算法一般只适用于某一领域,而在另一领域的适用性往往较差,新的应用还需要研究新的算法才能解决。本文基于微博,对利用微博获取用户兴趣并进行个性化推荐的方法展开了研究和探索。相较于目前的研究工作,本文主要存在以下三方面的不同。首先,考虑到当前针对中文语言的信息处理算法中存在的不足,提出将提取多特征属性的文本相似性判别思想运用到微博文本中,通过多角度的提取词条特征项,来提高文本表示的准确性,并减少文本语义信息量的损失。其次,使用外部语料库来确定用户兴趣分类,并以此来丰富微博语义、克服因微博内容简短而带来的主题模型数目不易确定的问题。此外,受Ebbinghaus遗忘曲线的启发,我们认为人类的兴趣并不总是一成不变的,在传统基于内容的推荐算法的基础上,提出基于时间权重函数的个性化推荐算法,用以剔除用户过期兴趣,并区分实时兴趣。最后,我们设置多组实验,经对比发现,本文中提出的提取多特征属性、应用外部语料库来进行用户兴趣分类和考虑用户兴趣随时间变化的思想能有效缓解传统方法在处理微博文本方面存在的问题,提高推荐精度。
【关键词】:社交网络 兴趣分析 文本相似性计算 时间权重函数 个性化推荐
【学位授予单位】:济南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.09
【目录】:
  • 摘要7-8
  • Abstract8-10
  • 第一章 绪论10-20
  • 1.1 研究背景和意义10-12
  • 1.2 国内外研究现状12-15
  • 1.2.1 文本挖掘相关研究12-13
  • 1.2.2 用户兴趣分析13-14
  • 1.2.3 个性化推荐14-15
  • 1.3 论文主要工作、创新点和面临的挑战15-17
  • 1.3.1 论文主要工作15-16
  • 1.3.2 本文创新点16
  • 1.3.3 本文面临的挑战16-17
  • 1.4 论文组织结构17-20
  • 第二章 相关概念和方法20-30
  • 2.1 微博20-21
  • 2.2 文本相似性判别21-26
  • 2.2.1 本章概述21
  • 2.2.2 文本相似性判别的基本流程21-26
  • 2.3 二维特征集合相关概念26-27
  • 2.4 本章小结27-30
  • 第三章 微博的用户兴趣分析与个性化推荐方法研究30-38
  • 3.1 本章概述30
  • 3.2 引入外部语料库30-32
  • 3.3 用户兴趣分析32-35
  • 3.3.1 遗忘曲线33
  • 3.3.2 基于遗忘曲线的时间权重函数33-34
  • 3.3.3 用户兴趣分析算法及流程描述34-35
  • 3.4 个性化推荐35-36
  • 3.5 本章小结36-38
  • 第四章 实验方案设计与结果分析38-46
  • 4.1 实验数据集38-39
  • 4.2 评价标准39-40
  • 4.3 与基于单特征值提取算法的实验对比40-42
  • 4.4 与未考虑时间权重的传统算法的实验对比42-44
  • 4.5 与未引入外部语料库的传统算法的实验对比44-45
  • 4.6 本章小结45-46
  • 第五章 针对微博的个性化推荐系统实现46-52
  • 5.1 系统简介46
  • 5.2 系统结构46-49
  • 5.2.1 用户登录模块46-48
  • 5.2.2 后台定时更新模块48
  • 5.2.3 兴趣分类模块48-49
  • 5.2.4 个性化推荐模块49
  • 5.3 系统实现与应用49
  • 5.4 本章小结49-52
  • 第六章 结论与展望52-54
  • 6.1 全文总结52
  • 6.2 进一步研究展望52-54
  • 参考文献54-58
  • 致谢58-60
  • 附录60

【相似文献】

中国期刊全文数据库 前10条

1 欧洁;林守勋;刘桂林;;个性化智能信息提取中的用户兴趣发现[J];计算机科学;2001年03期

2 蒋学锋;;用户兴趣的结构和个性化服务的实现[J];计算技术与自动化;2005年04期

3 李钝;曹元大;张龙飞;;用户兴趣优化过滤方法研究[J];计算机工程;2006年20期

4 费洪晓;戴弋;穆s,

本文编号:403897


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/403897.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9ad21***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com