当前位置:主页 > 管理论文 > 营销论文 >

众包营销中微博与水军的联合检测

发布时间:2020-07-11 16:07
【摘要】:近年来,随着互联网技术的飞速发展,在线社交网站已成为人们获取实时信息的重要渠道。然而,社交网站中信息传播的便捷性也使其成为了网络水军散布广告和诈骗信息的工具,给网络环境带来了严重的负面影响。另一方面,众包服务的兴起给多人在线合作提供了途径,并由此催生了各种众包平台,但同时其中数量众多的众包营销任务也诱使大量的众包用户以水军的身份参与到社交网站的营销推广活动中。不同于传统的由脚本控制的水军账号,这些众包参与者的背后通常是真实的用户,与正常用户更为相似,也因此其发布的信息拥有更强的欺骗性,给水军检测带来了新的挑战。本文以新浪微博中的众包营销活动为研究场景。针对已有研究缺乏对于众包机制的深层次挖掘以及忽略众包水军和营销微博间紧密联系性的问题,本文从用户和微博两个角度同时切入,分析并量化二者在众包营销活动中体现出来的异常特征,结合关注与转发网络拓扑,提出一种联合检测模型与算法,目的是更精确、全面地检测众包水军及营销微博。论文的主要内容包括:首先,本文对用户间的关注关系拓扑以及用户与微博间的转发关系拓扑进行建模,针对因众包营销而产生的拓扑关系,基于标签传播和最优化的思想,构建相应的优化目标函数。在此基础之上,进一步建立众包营销微博与水军联合检测模型,将对众包水军与营销微博的检测问题转化为带约束的优化目标求解问题。其次,本文从众包营销活动特有的机制出发,从用户属性、行为、微博评论等不同角度挖掘二者的异常特征,并作为先验知识加入到联合检测模型中。在此之后,基于交替迭代的思想,设计众包营销微博与水军联合检测算法(Crowdturfing Microblogs and Spammers Co-detection Algorithm,CMSCA),对模型进行求解。最后,基于爬取的真实众包营销数据集,对算法的有效性进行实验验证并与相关算法进行对比。通过对本文实验结果的分析可以得出:本文所提出的CMSCA算法相较于其他算法能更为准确地检测众包水军与营销微博;与此同时,本文提取的异常特征能有效地提升算法的检测效果;除此之外,CMSCA算法中蕴含的联合检测的思想能够充分利用众包水军与营销微博之间的联系,对二者的检测结果有着互相促进的作用。本文对社交网站中众包营销活动的研究,不仅能够帮助网站本身进一步完善其水军检测机制,减少因广告诈骗信息的泛滥所导致的网络带宽资源的浪费,而且也有助于社交网络舆论信息的监管,并最终为用户创造更为良好的网络环境。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.092
【图文】:

水军,欺诈性,社交,偏见


东南大学硕士学位论文任务,要求用户登录自己的新浪微博账号,对某一条指定的微博进行转发评论,以进一步扩大原微博的受众面。这种任务使得参与的众包用户成为水军,做出与传统社交网络水军相似的行为。此类行为的目的一般是广告营销,而又以众包任务的形式发布,因此本文将其称为为“众包营销”。类似的众包营销现象在互联网中并不少见,如 2010 年至2014 年,四年中奇虎 360 与腾讯两家公司都被报道由于利益冲突而有雇佣水军推广自家软件产品并攻击对方的行为[7]。同时,上文中提到的“豆瓣”水军刷分现象也是众包营销的一种体现,国内网站中众包营销活动的猖獗可见一斑。相关研究发现,近年来,全球的众包网站中众包营销相关的任务的数量在持续上涨[9],并且众包水军在参与众包营销活动时,会在新浪微博等社交媒体上发布大量垃圾信息,从而为特定产品提升在搜索引擎中的排名以及给网站增加流量,整个众包活动的运作流程与实际效果能很有效地接近正常用户[8],因此也可以达到较强的欺骗性,对于众包营销活动的分析以及众包水军的检测就显得具有重大的现实意义。

营销流程


新浪微博众包营销流程

总体框架,数据采集


可靠并具有时效性的数据集是对社交网络展开研究的基础。特别是本文所用户相关的研究,更是需要真实的数据以支撑实验工作,进而验证算法的有效文以众包营销为研究场景,相比于一般的社交水军场景更为特殊,目前未接受的公开数据集。因此,本文将从零开始对实验所需数据进行采集。下面集的采集逻辑,对数据集进行统计分析以验证其合理性和适用性,最后介绍的正负例标注方法。据集获取文将从三打哈网站和新浪微博网站分别获取众包任务数据以及用户与微博。爬虫程序的实现方面,Scrapy 作为一款由 Python 开发的网络爬虫开源框架于框架的完整、易用和可拓展性。因此,本文以 Scrapy 框架为基础进行相关工作,并在此基础之上,结合高性能内存数据库 Redis,实现分布式的数据本文的数据采集总体框架如图 2.3 所示:

【相似文献】

中国期刊全文数据库 前10条

1 马旭燕;;众包在项目翻译教学中的应用初探[J];上海翻译;2017年06期

2 王志宏;傅长涛;李阳阳;;众包的行业应用研究述评[J];长安大学学报(社会科学版);2017年05期

3 李洋;温亮明;李健;;国内图书馆众包研究文献综述[J];知识管理论坛;2018年02期

4 刘彤;;关于档案众包的分析与研究[J];山东档案;2018年04期

5 曾婧婧;;国外政府资助型科研众包研究综述[J];中国科技论坛;2016年12期

6 郝迎春;祖菊;;人力资源众包服务平台应用研究[J];企业改革与管理;2017年07期

7 张永云;张生太;吴翠花;;嵌入还是卷入:众包个体缘何贡献知识?[J];科研管理;2017年05期

8 张宏树;陈雪波;;众包十年背景下的众筹新闻再考察[J];青年记者;2017年17期

9 任重;;基于万众创新的科研众包研究:定义、理论内涵与启示[J];自然辩证法通讯;2017年04期

10 王晔;;科研众包模式下图书馆支持服务研究[J];图书馆研究;2017年04期

中国重要会议论文全文数据库 前10条

1 刘世群;李思佳;倪世光;彭凯平;;众包:移动互联网时代的心理研究工具[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年

2 尹彦;张晋冉;;天津市民参与快递众包意愿的实证研究[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(中)[C];2017年

3 赵巍;;众包负面效应及潜在风险研究[A];“决策论坛——企业行政管理与创新学术研讨会”论文集(上)[C];2016年

4 任延静;林丽慧;;众包平台创新竞赛中加价延期机制采纳决策的研究[A];第八届(2013)中国管理学年会——信息管理分会场论文集[C];2013年

5 周素红;彭伊侬;;众包理念下的参与式新型城市治理[A];持续发展 理性规划——2017中国城市规划年会论文集(12城乡治理与政策研究)[C];2017年

6 张铮;;O2O众包模式交通事故的责任承担——以车辆挂靠关系为类推[A];法院改革与民商事审判问题研究——全国法院第29届学术讨论会获奖论文集(下)[C];2018年

7 刘汕;邓琼;;互联网环境下众包创新服务绩效的关键影响因素研究[A];第十五届全国计算机模拟与信息技术学术会议论文集[C];2015年

8 王冬升;黄健;;利用众包方式解决地理国情覆盖分类监测[A];第二十届华东六省一市测绘学会(江苏)学术交流会论文集[C];2018年

9 陈鹤阳;陈婧;;众包模式下应急管理的情报分析[A];“四个全面”·创新发展·天津机遇——天津市社会科学界第十一届学术年会优秀论文集(中)[C];2015年

10 刘春成;唐松源;Chongyi Wei;Joseph Tucker;;从群众中来,到群众中去:众包与健康传播[A];2015年度中国健康传播大会优秀论文集[C];2015年

中国重要报纸全文数据库 前10条

1 本报记者 胡军;全民快递时代 安全问题待解[N];中国消费者报;2016年

2 记者 杨梅 梅文婷;罚众包管理公司万元 邀请骑手担当志愿者[N];上海法治报;2019年

3 本报记者 张露;华少加盟“众包造车” 中国好汽车要出炉了[N];中国青年报;2015年

4 省政协委员 李明喜;致力打造科研众包平台[N];江淮时报;2017年

5 陈健秀 夏福良;从打包生产走向众包定制[N];中国石化报;2018年

6 苏报评论员 金根;攻关技术瓶颈,“科研众包”有戏[N];苏州日报;2018年

7 记者 吴洁;从“双创”到“四众” 创客们准备好了吗[N];昆明日报;2016年

8 季征;云南:搭建平台释放创业创新能量[N];云南经济日报;2016年

9 本报记者 季征;搭建平台释放创业创新能量[N];云南日报;2016年

10 记者 邱登科;广东公布首批科研众包培育平台[N];民营经济报;2017年

中国博士学位论文全文数据库 前10条

1 张立晔;基于众包的WLAN室内定位技术研究[D];哈尔滨工业大学;2018年

2 提倪(Muhammad Zahid Tunio);面向众包软件开发的任务分配技术研究[D];北京邮电大学;2018年

3 李绍园;多标记众包学习研究[D];南京大学;2018年

4 宋奕;智能环境下众包物流企业员工组织行为与运作的仿真研究[D];华中科技大学;2018年

5 向为;创意设计柔性众包的方法与应用[D];浙江大学;2017年

6 吴薇;众包竞赛情境下接包者持续参与行为研究:竞争自我效能的作用[D];中国科学技术大学;2018年

7 林素芬;基于众包参与者网络的众包绩效提升研究[D];华侨大学;2015年

8 冯小亮;基于双边市场的众包模式研究[D];武汉大学;2012年

9 饶华铭;人本计算系统中众包数据质量控制方法的改进及其应用研究[D];南京理工大学;2017年

10 庞建刚;众包社区创新的运营机制设计[D];中国科学技术大学;2014年

中国硕士学位论文全文数据库 前10条

1 黄希威;A公司互联网环境下的众包模式运行机制研究[D];厦门大学;2017年

2 王梦婧;基于众包的物流配送调度优化方案[D];哈尔滨工业大学;2017年

3 莫小燕;基于众包手机数据的实时路况估计和路径规划研究[D];哈尔滨工业大学;2017年

4 张玉;《众包与网络协作翻译》(第五章)翻译报告[D];河南大学;2018年

5 常峥;《众包与网络协作翻译》(第八章)翻译报告[D];河南大学;2018年

6 王允;《众包与网络协作翻译》(第三章)翻译报告[D];河南大学;2018年

7 孔晓晓;《众包与网络协作翻译》(第二章)翻译报告[D];河南大学;2018年

8 李海刚;《众包与网络协作翻译》(第一章)翻译报告[D];河南大学;2018年

9 韩效东;LAM众包平台的功能设计优化[D];吉林大学;2018年

10 李洋;空间众包中的任务分配算法研究[D];苏州大学;2018年



本文编号:2750622

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/2750622.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a80b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com