当前位置:主页 > 管理论文 > 移动网络论文 >

互联网社区问答平台上基于“众包”的信息污染:测量、分析与防治

发布时间:2017-05-11 13:15

  本文关键词:互联网社区问答平台上基于“众包”的信息污染:测量、分析与防治,由笔耕文化传播整理发布。


【摘要】:“众包”的工作方式由来已久,并且日益盛行。通过“众包”的方式,雇主可以从人群中购买服务,整合人力来完成一个复杂的工作。近些年来,“众包”方式被广泛应用于互联网中,“众包”平台就是作为该方式的运行媒介而产生的。然而,“众包”平台在为大规模社会合作提供基础服务的同时也经常被恶意使用,雇主可以雇佣大量人力向网络发布大量带有偏见的评论和垃圾信息,甚至包含病毒的链接。这种由“众包”平台导致的向网络信息污染,其用户参与度高、影响范围广,俨然已经形成了一个完整的网络生态系统,对网络安全造成严重的威胁。但是,人们对这样的生态系统仍缺乏认识,任由其对信息资源以及人类身心健康等造成损害或其他负面影响。 本文首次聚焦于“众包”平台中的“黑暗面”,研究了产生于“猪八戒”(大型中文“众包”平台)上,以“百度知道”(国内最大的社区问答平台)为污染目标的“众包”活动。提出了一个大规模的网络测量方法来收集“猪八戒“和“百度知道”的数据。通过把“猪八戒“的“众包”需求和威客,以及“百度知道“的垃圾账号和垃圾信息连接起来,提出一个隐藏于“众包”平台下的对网络信息造成污染的网络生态系统。同时从垃圾信息的规模与范围、威客的“女巫账号”及其相互合作、威客的工作与报酬、“众包”活动的质量控制等不同方面全面深入地分析了该生态系统。另外,基于对“众包”中产生垃圾信息的生态系统的理解以及对社区问答平台中的垃圾账号和普通账号的行为差异的分析,提出一个全新的垃圾账号鉴别方法。
【关键词】:“众包” 社区问答平台 信息污染 社会网络 垃圾鉴别
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.08
【目录】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第一章 绪论11-19
  • 1.1 研究背景与意义11-13
  • 1.1.1 “众包”平台11-12
  • 1.1.2 社区问答平台12-13
  • 1.2 国内外研究现状13-16
  • 1.2.1 对社交网络中的信息污染的相关研究13-14
  • 1.2.2 对“众包”平台的研究14-15
  • 1.2.3 对社区问答平台的相关研究15-16
  • 1.3 本文研究内容和主要贡献16-17
  • 1.4 文章组织结构17-19
  • 第二章 数据收集19-33
  • 2.1 数据源介绍19-24
  • 2.1.1 “猪八戒”19-22
  • 2.1.2 “百度知道”22-24
  • 2.2 数据获取24-28
  • 2.2.1 “猪八戒”数据获取24-25
  • 2.2.2 “百度知道”数据获取25-28
  • 2.3 连接两个数据集并分析28-31
  • 2.3.1 跟踪“猪八戒”威客到其所用的“百度知道”账号28-30
  • 2.3.2 垃圾问题的存活情况30-31
  • 2.4 本章小结31-33
  • 第三章 “众包”中从事垃圾信息发布的网络生态系统33-43
  • 3.1 垃圾信息的规模与分布范围33-34
  • 3.2 百度知道垃圾账号34-35
  • 3.3 “女巫账号“以及“女巫账号”号间的“勾结”情况35-37
  • 3.4 威客的努力与回报37-40
  • 3.5 “众包”活动的质量控制40-42
  • 3.6 本章小结42-43
  • 第四章 “百度知道”垃圾账号鉴别43-57
  • 4.1 准备工作43-44
  • 4.1.1 使用工具介绍43
  • 4.1.2 构建网络图43-44
  • 4.2 属性选择44-47
  • 4.2.1 个人信息属性44
  • 4.2.2 问题/答案属性44-45
  • 4.2.3 社会网络属性45-47
  • 4.3 属性排序与属性分析47-50
  • 4.4 实现鉴别系统50-54
  • 4.4.1 使用样本集50-51
  • 4.4.2 分类算法选择51-52
  • 4.4.3 性能评估方法52-53
  • 4.4.4 训练分类器53-54
  • 4.5 本章小结54-57
  • 第五章 总结57-59
  • 参考文献59-63
  • 致谢63-65
  • 在读期间发表的学术论文与取得的其他研究成果65

【共引文献】

中国期刊全文数据库 前10条

1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期

2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期

3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期

4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期

5 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期

6 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期

7 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期

8 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期

9 左吉峰;乔均俭;;ID3算法的合理性证明及实验分析[J];保定学院学报;2008年04期

10 王晓红,高洪深;数据挖掘技术在大型超市中的应用研究[J];北方工业大学学报;2003年03期

中国重要会议论文全文数据库 前10条

1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年

2 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年

3 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年

4 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年

5 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年

6 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年

7 叶中行;陆青;余敏杰;;计算智能在银行信贷信用分类中的应用[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年

8 徐怡;余斌;李龙澍;;粗糙集在决策树生成中的应用[A];2005中国控制与决策学术年会论文集(下)[C];2005年

9 ;Rough Set Based Autolanding Control[A];第二十三届中国控制会议论文集(下册)[C];2004年

10 刘东升;;基于Mobile Agent的分布式ID3挖掘模型[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

中国博士学位论文全文数据库 前10条

1 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年

2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年

3 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年

4 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年

5 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年

6 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年

7 李军;不平衡数据学习的研究[D];吉林大学;2011年

8 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年

9 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年

10 杨明;分布式环境下的安全策略关键技术研究[D];吉林大学;2011年

中国硕士学位论文全文数据库 前10条

1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年

2 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年

3 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年

4 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年

5 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年

6 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年

7 郑陶;基于平面向量的决策树算法在高考志愿选择系统中的应用[D];辽宁工程技术大学;2010年

8 孙怡哲;一种改进的决策树算法研究与应用[D];辽宁工程技术大学;2010年

9 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年

10 周翔;决策支持技术在企业销售系统中的应用研究[D];中国海洋大学;2010年


  本文关键词:互联网社区问答平台上基于“众包”的信息污染:测量、分析与防治,,由笔耕文化传播整理发布。



本文编号:357344

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/357344.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1b753***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com