社交媒体中内容的标注与排序

发布时间:2017-10-06 01:41

  本文关键词:社交媒体中内容的标注与排序


  更多相关文章: 标签推荐 内容标注 个性化排序 用户兴趣建模


【摘要】:面对社交媒体中快速更新的数据,帮助用户发现和组织有价值的内容已经成为了一项非常有意义的工作。本工作主要研究两个关键技术:(1)内容的标注:找到准确描述物品内容的标签,帮助用户理解内容并对物品进行组织。标签可以作为一个桥梁将网页、短文本、图片、视频等多种形式的内容联系到一起;(2)内容的排序:根据用户的个人偏好、时间、空间等因素对物品进行排序,帮助用户从海量的数据中快速找到感兴趣的内容。论文的主要研究工作和贡献包括:1.社交书签系统中的标签推荐:为了降低数据的稀疏性,本工作充分利用了三种新的关系来进行个性化标签推荐:用户的社交网络、标签的语义关联度、物品的内容相似性。本工作在异构图上拓展了监督式的随机游走模型,并通过求解最优化问题找到了点和边的最佳权重。实验结果表明我们的算法在使用相同的信息时要优于对比方法,并且能够通过融合新的关系来进一步提高推荐的准确率。2.微博短文本的主题标签推荐:主题标签是社交书签在微博文本上的延伸。首先,我们讨论了爆发式主题标签、个人主题标签、常用主题标签的特点以及内容相关、用户相关的推荐策略。然后我们提出了基于混合策略的主题标签推荐算法,帮助用户更加方便地使用主题标签。算法考虑了微博的特有格式、用户的标注习惯、主题标签的时效性等信息。实验结果表明我们的算法要优于已有的基于微博内容的算法和基于用户兴趣的算法。3.微博短文本的个性化排序:微博默认是按时间进行排序的,用户需要不断翻页浏览才能发现感兴趣的内容。我们根据用户的转发历史来对个人的偏好进行建模,将微博按照用户的感兴趣程度进行排序。算法充分考虑到了微博的内容质量、作者的权威度、用户兴趣和微博内容的一致性、用户对作者的关注度等信息。实验结果表明我们的方法要优于已有的方法,并且分析了各个因素的重要程度。4.微博事件的标注与排序:我们提出了一个实时的主题标签聚类算法,将事件表示为一组高质量的主题标签。为了帮助用户从大量的事件中快速发现有价值的信息,我们根据事件的流行程度、突发性、本地性对事件进行综合排序。为了帮助用户以不同的时间、空间粒度浏览事件,我们用时间、空间构成的数据立方体组织事件,并根据层次结构增量式地合并聚类结果。实验结果表明我们的方法能够提供高质量的聚类和排序结果,并且具有良好的可拓展性。
【关键词】:标签推荐 内容标注 个性化排序 用户兴趣建模
【学位授予单位】:清华大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
  • 摘要3-4
  • Abstract4-10
  • 第1章 绪论10-20
  • 1.1 选题背景和研究动机10-17
  • 1.1.1 社交书签系统中的标签推荐11-13
  • 1.1.2 微博短文本的主题标签推荐13-15
  • 1.1.3 微博短文本的个性化排序15-16
  • 1.1.4 微博事件的标注与排序16-17
  • 1.2 主要研究内容和贡献点17-19
  • 1.3 章节安排19-20
  • 第2章 社交书签系统中的标签推荐20-40
  • 2.1 引言20-22
  • 2.2 相关工作22-23
  • 2.3 基础知识23-24
  • 2.4 异构图上的随机游走算法24-28
  • 2.4.1 状态转移矩阵25-26
  • 2.4.2 偏好向量26
  • 2.4.3 随机游走模型26-28
  • 2.5 最优化问题28-33
  • 2.5.1 目标函数28-29
  • 2.5.2 求解最优化问题29-30
  • 2.5.3 梯度的计算30-32
  • 2.5.4 收敛性证明32-33
  • 2.6 实验评价33-39
  • 2.6.1 数据集33-34
  • 2.6.2 对比方法34-35
  • 2.6.3 评价指标35
  • 2.6.4 参数设定35-36
  • 2.6.5 实验结果36-39
  • 2.7 本章小结39-40
  • 第3章 微博短文本的主题标签推荐40-60
  • 3.1 引言40-41
  • 3.2 相关工作41-43
  • 3.3 数据分析43-44
  • 3.4 算法概述44-48
  • 3.4.1 推荐策略44-46
  • 3.4.2 算法框架46-48
  • 3.5 算法细节48-54
  • 3.5.1 内容相关性48-49
  • 3.5.2 用户相关性49-51
  • 3.5.3 主题标签特征51-52
  • 3.5.4 最优化问题52-54
  • 3.6 实验评价54-59
  • 3.6.1 数据集54-55
  • 3.6.2 评价指标55
  • 3.6.3 对比方法55-56
  • 3.6.4 实验结果56-58
  • 3.6.5 各部分的贡献58-59
  • 3.7 本章小结59-60
  • 第4章 微博短文本的个性化排序60-79
  • 4.1 引言60-61
  • 4.2 相关工作61-62
  • 4.3 基础知识62-63
  • 4.3.1 问题定义62
  • 4.3.2 传统矩阵分解方法的问题62-63
  • 4.4 算法概述63-67
  • 4.4.1 点的特征64-66
  • 4.4.2 边的特征66
  • 4.4.3 特征的预处理66-67
  • 4.5 算法细节67-73
  • 4.5.1 人工特征和隐偏移67-69
  • 4.5.2 基于特征的矩阵分解模型69-71
  • 4.5.3 最优化问题71-72
  • 4.5.4 求解最优化问题72-73
  • 4.5.5 复杂度分析73
  • 4.6 实验评价73-78
  • 4.6.1 数据集73-74
  • 4.6.2 评价指标74
  • 4.6.3 对比方法74-75
  • 4.6.4 实验结果75-76
  • 4.6.5 各部分的贡献76-77
  • 4.6.6 运行时间77-78
  • 4.7 本章小结78-79
  • 第5章 微博事件的标注与排序79-102
  • 5.1 引言79-81
  • 5.2 相关工作81-82
  • 5.3 模型框架82-85
  • 5.4 主题标签聚类85-90
  • 5.4.1 表示方法和相似性85-86
  • 5.4.2 静态主题标签的聚类86-88
  • 5.4.3 动态主题标签的聚类88-90
  • 5.4.4 聚类结果的合并90
  • 5.5 事件排序90-93
  • 5.5.1 排序的因素90-91
  • 5.5.2 排序函数91-92
  • 5.5.3 Top-k事件查询92-93
  • 5.6 实验评价93-100
  • 5.6.1 数据集93
  • 5.6.2 评价指标93
  • 5.6.3 对比方法93-94
  • 5.6.4 定性分析94-98
  • 5.6.5 定量分析98-99
  • 5.6.6 可拓展性99-100
  • 5.6.7 内存使用100
  • 5.7 本章小结100-102
  • 第6章 总结与展望102-105
  • 6.1 论文主要研究工作总结102-103
  • 6.2 进一步研究工作展望103-105
  • 参考文献105-111
  • 致谢111-113
  • 个人简历、在学期间发表的学术论文与研究成果113-114

【相似文献】

中国期刊全文数据库 前10条

1 林茜卡;傅秀芬;滕少华;李云;;协同标签系统的应用研究[J];暨南大学学报(自然科学与医学版);2009年01期

2 吴超;周波;;基于复杂网络的社会化标签分析[J];浙江大学学报(工学版);2010年11期

3 吴金成;曹娇;赵文栋;张磊;;标签集中式发布订阅机制性能分析[J];指挥控制与仿真;2010年06期

4 李晓燕;陈刚;寿黎但;董金祥;;一种面向协作标签系统的图片检索聚类方法[J];中国图象图形学报;2010年11期

5 袁柳;张龙波;;基于概率主题模型的标签预测[J];计算机科学;2011年07期

6 张斌;张引;高克宁;郭朋伟;孙达明;;融合关系与内容分析的社会标签推荐[J];软件学报;2012年03期

7 王永刚;严寒冰;许俊峰;胡建斌;陈钟;;垃圾标签的抵御方法研究[J];计算机研究与发展;2013年10期

8 汪祥;贾焰;周斌;陈儒华;韩毅;;基于交互关系的微博用户标签预测[J];计算机工程与科学;2013年10期

9 顾亦然;陈敏;;一种三部图网络中标签时间加权的推荐方法[J];计算机科学;2012年08期

10 赵亚楠;董晶;董佳梁;;基于社会化标注的博客标签推荐方法[J];计算机工程与设计;2012年12期

中国重要会议论文全文数据库 前6条

1 朱广飞;董超;王衡;汪国平;;照片标签的智能化管理[A];第四届和谐人机环境联合学术会议论文集[C];2008年

2 房冠南;袁彩霞;王小捷;李江;宋占江;;面向对话语料的标签推荐[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 梅放;林鸿飞;;基于社会化标签的移动音乐检索[A];第五届全国信息检索学术会议论文集[C];2009年

4 李静;林鸿飞;;基于用户情感标签的音乐检索算法[A];第六届全国信息检索学术会议论文集[C];2010年

5 骆雄武;万小军;杨建武;吴於茜;;基于后缀树的Web检索结果聚类标签生成方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

6 王波;唐常杰;段磊;尹佳;左R,

本文编号:980008


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/980008.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户65386***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com