当前位置:主页 > 科技论文 > 数学论文 >

基于用户圈和内容联动关系的UGC内容质量评估

发布时间:2017-09-25 02:11

  本文关键词:基于用户圈和内容联动关系的UGC内容质量评估


  更多相关文章: 用户产生内容 复杂网络分析 内容质量评估 UCCC算法 用户圈划分


【摘要】:随着移动互联网和社交网络的大规模普及,越来越多的用户每天会产生数以亿计的用户产生内容(UGC)。然而,由于用户发表内容的门槛的降低,任何用户在任何时间都可以发表自己的想法,因此,也导致了用户产生内容的质量参差不齐。但是用户产生内容无论在商业价值的挖掘还是在政府对舆论的监督等方面都有着重要的作用,因此,在大规模的UGC数据中寻找高质量的内容就成为了一个重要的研究课题。在本文中,我们提出了一种新的UGC质量的评估方法,该方法使用了在社交网络中的用户圈结构,也就是一些兴趣爱好相似的人组成的一种社区结构。从直观来看,内容吸引用户圈的数量比吸引用户的数量更加能够表现其内容的质量。因为这说明该内容覆盖的用户层面更广,更具有潜力成为热点内容。因此,本文提出了基于用户圈和内容联动关系的UGC内容质量评估算法,简称UCCC算法。UCCC算法基于用户圈网络图,内容网络图和用户圈-内容网络图进行计算。其计算原理是基于用户圈-内容质量的互增强原理。即与内容相关的用户圈质量越高,内容质量越高;而内容的质量越高,也证明与其相关的用户圈的质量也越高。 本文基于真实的数据进行了UGC质量评估实验,实验结果表明UCCC算法在大部分实验数据上的评估效果要优于其他的算法,同时也证明了用户圈维度特征相比用户维度在UGC质量评估中更加有效。 本论文研究得到国家自然科学基金项目“基于hLDA层次主题模型的中文多文档摘要研究”(项目批准号:61202247)和“面向不确定性的Web2.0用户创作内容管理研究”(项目批准号:71231002)的资助。
【关键词】:用户产生内容 复杂网络分析 内容质量评估 UCCC算法 用户圈划分
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O157.5
【目录】:
  • 摘要4-6
  • ABSTRACT6-8
  • 目录8-11
  • 第一章 绪论11-15
  • 1.1 研究背景及意义11-12
  • 1.1.1 研究背景11
  • 1.1.2 研究意义11-12
  • 1.2 国内外研究现状12-13
  • 1.3 本课题研究工作13
  • 1.4 论文结构安排13-15
  • 第二章 UGC质量评估中运用的模型及算法15-27
  • 2.1 PageRank算法15-17
  • 2.1.1 PageRank算法前提15
  • 2.1.2 PageRank算法原理15-16
  • 2.1.3 PageRank算法修正16
  • 2.1.4 PageRank算法的优缺点16-17
  • 2.2 HITS算法17-18
  • 2.2.1 HITS算法前提17
  • 2.2.2 HITS算法基本思想和计算方法17
  • 2.2.3 HITS算法存在的问题17-18
  • 2.3 意见领袖发现算法18-22
  • 2.3.1 意见领袖18-19
  • 2.3.2 TwitterRank算法19-20
  • 2.3.3 IP算法20-22
  • 2.4 LDA主题模型22-23
  • 2.4.1 词袋模型22
  • 2.4.2 LDA模型核心思想22-23
  • 2.4.3 潜在狄利克雷分配特点23
  • 2.5 图分割算法23-25
  • 2.5.1 复杂网络23-24
  • 2.5.2 GN算法24
  • 2.5.3 Fast Unfolding算法24-25
  • 2.6 文本相似度计算方法25-26
  • 2.6.1 TF-IDF算法25
  • 2.6.2 余弦相似度算法25-26
  • 2.7 本章小结26-27
  • 第三章 UGC质量评估框架27-33
  • 3.1 构建用户圈网络图G_(UC)27-28
  • 3.1.1 构建用户网络图G_U27-28
  • 3.1.2 划分用户圈28
  • 3.1.3 构建用户圈网络图G_(UC)28
  • 3.2 构建内容网络图G_(CT)28-29
  • 3.3 构建内容-用户圈网络图G_(CC)29-31
  • 3.3.1 计算用户发布的内容与指定内容的相似度29-30
  • 3.3.2 计算内容-用户圈的转移概率30
  • 3.3.3 计算用户圈-内容的转移概率30-31
  • 3.4 UGC质量评估计算方法(UCCC)31-32
  • 3.4.1 构建转移概率矩阵31
  • 3.4.2 UGC质量评估计算方法31-32
  • 3.5 本章小结32-33
  • 第四章 基于用户和内容联动关系的UGC内容质量评估33-36
  • 4.1 构建用户-内容网络图33-34
  • 4.1.1 计算内容到用户的边的权重33-34
  • 4.1.2 计算用户到内容的边的权重34
  • 4.2 构建转移概率矩阵34
  • 4.3 UCC算法进行UGC质量评估34-35
  • 4.4 本章小结35-36
  • 第五章 UGC内容质量评估实验36-50
  • 5.1 数据准备和预处理36-37
  • 5.2 构建用户网络图并划分用户圈37-39
  • 5.3 实验及结果分析39-48
  • 5.4 本章小结48-50
  • 第六章 总结与展望50-51
  • 6.1 本文的工作总结50
  • 6.2 未来展望50-51
  • 参考文献51-53
  • 致谢53-54
  • 攻读硕士学位期间发表的论文54

【共引文献】

中国期刊全文数据库 前10条

1 邓群钊;贾仁安;梁英培;;多层次多轮实地群决策法及其应用[J];安徽农业科学;2006年08期

2 杨朗;陈恩海;黄立飞;;系统科学在害虫管理中的应用[J];安徽农业科学;2009年21期

3 宋波,叶文虎;从增长和稳定的角度重新认识可持续发展的内涵[J];北京大学学报(哲学社会科学版);2004年04期

4 戴汝为;“人机结合”的大成智慧[J];北方工业大学学报;1996年03期

5 方芳;;金融复杂系统脆性理论在金融危机分析中的应用[J];北方经济;2011年06期

6 张江;李学伟;;认知模型与统一集[J];北京交通大学学报;2005年06期

7 梁为亮;赵金超;;武器装备综合集成的体系结构与建模[J];兵工自动化;2006年12期

8 李彦斌,李涛,张文泉;管理科学面临复杂性科学的挑战[J];北京航空航天大学学报(社会科学版);2004年02期

9 马蔼乃;论地理科学的发展[J];北京大学学报(自然科学版);1996年01期

10 王亮;卢永锦;;引用预见信息的人机耦合优化方法[J];北京航空航天大学学报;2008年04期

中国重要会议论文全文数据库 前10条

1 吴庆洲;;迎接中国城市营建史研究之春天[A];《营造》第五辑——第五届中国建筑史学国际研讨会会议论文集(上)[C];2010年

2 邓方;陈杰;陈文颉;朱琳;;元胞自动机及其在兵力推演中的建模与仿真[A];第二十六届中国控制会议论文集[C];2007年

3 王春生;吴敏;曹卫华;;基于集成预测模型与专家推理策略的铅锌烧结配料优化方法[A];第二十六届中国控制会议论文集[C];2007年

4 魏红英;黄石旺;;混沌理论的前沿性及其对公共行政的贡献[A];地方政府发展研究(第三辑)[C];2008年

5 赵德勇;刘建国;;基于复杂性科学的综合集成研讨厅研究现状与发展[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年

6 李亚;李习彬;;共赢方法论——协调社会利益关系的系统方法论[A];经济全球化与系统工程——中国系统工程学会第16届学术年会论文集[C];2010年

7 刘怡君;唐锡晋;顾基发;;专家会商的方法支持与工具应用[A];经济全球化与系统工程——中国系统工程学会第16届学术年会论文集[C];2010年

8 王德光;胡宝清;覃开贤;;复杂性科学在喀斯特土地利用系统研究中的应用[A];发挥资源科技优势 保障西部创新发展——中国自然资源学会2011年学术年会论文集(上册)[C];2011年

9 李存金;;大规模科学技术工程复杂系统管理方法论研究[A];第十三届中国管理科学学术年会论文集[C];2011年

10 王阶;何庆勇;姚魁武;朱明军;马长生;叶勇;王永霞;林谦;衷敬柏;汤艳莉;熊兴江;荆鲁;农一兵;;以证候要素为内容的冠心病心绞痛中医疗效评价体系研究[A];2011年中华中医药学会心病分会学术年会暨北京中医药学会心血管病专业委员会年会论文集[C];2011年

中国博士学位论文全文数据库 前10条

1 杨莉;基于可持续发展的我国电源结构优化研究[D];哈尔滨工程大学;2010年

2 王劲松;复杂系统脆性理论及其在电力系统风险分析中的应用[D];哈尔滨工程大学;2010年

3 赵金宪;复杂系统脆性理论在煤矿生产系统脆性风险评价中的应用[D];哈尔滨工程大学;2010年

4 石云龙;基于CAS理论的地震紧急救援系统模型构建与模拟仿真[D];中国地质大学(北京);2010年

5 陶有德;可修复模型的系统分析[D];北京信息控制研究所;2010年

6 于群;电力系统大停电的自组织临界特性研究[D];中国电力科学研究院;2010年

7 罗国亮;灾害应对与中国政府治理方式变革研究[D];南开大学;2010年

8 张晨;我国资源型城市绿色转型复合系统研究[D];南开大学;2010年

9 雷国雄;不确定性、创新不足与经济演化[D];暨南大学;2010年

10 翁勇南;安全支撑体系及其演化机理研究[D];北京交通大学;2011年

中国硕士学位论文全文数据库 前10条

1 安军建;海洋船舶类复杂产品供应链协作机制研究[D];中国海洋大学;2010年

2 杨林;求解带性能约束圆集布局问题的启发式蚁群算法研究[D];湘潭大学;2010年

3 曹春苗;基于复杂网络的知识价值链建模及应用研究[D];中国海洋大学;2010年

4 张莉莉;青岛市突发公共事件应急管理研究[D];中国海洋大学;2010年

5 赵业清;钢铁生产流程的系统动力学建模与动态仿真[D];昆明理工大学;2008年

6 周洋洋;云南高原山区农村公路养护技术研究[D];昆明理工大学;2010年

7 张雪梅;基于SLEUTH模型的城市扩张分析及场景预测研究[D];昆明理工大学;2010年

8 尤荻;公共基础设施BOT-TOT-PPP集成融资模式应用研究[D];昆明理工大学;2008年

9 王荣华;HWME中“广义专家”群体网络研讨过程的链接结构及其分析算法研究[D];昆明理工大学;2009年

10 郑小亚;基于和谐理论的云南社会公共服务体系研究[D];昆明理工大学;2010年



本文编号:914764

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/914764.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77bc8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com