当前位置:主页 > 科技论文 > 搜索引擎论文 >

大数据杀熟及其对抗技术研究

发布时间:2020-09-04 09:38
【摘要】:在如今的社会中,互联网飞速发展,互联网商家利用掌握的用户信息来分析消费者的购买偏好,推荐商品以此实现利润最大化,浏览记录,购买东西,观看广告等的消费者在互联网中进行的行为数据累积,成为互联网公司用来分析用户的基础信息来源。这种行为虽然带来了许多便利,但是它的负面影响不容忽视,即“大数据杀熟”。目前,消费者使用手机软件来进行商业活动已经非常普遍,尤其是购物、生活服务的软件使用率在目前占有非常高的比重,大数据“杀熟”就藏匿在消费者常用的手机软件中。如在手机的团购软件中酒店房间、飞机票等的预定、出行打车、电影票购买等这些与生活息息相关的行为就性存在着大量的大数据“杀熟”行为,互联网商家平台利用过往掌握的用户的行为偏好数据分析不同消费水平的用户的不同使用习惯以及他们的使用需求,对互联网应用依赖性比较强的老用户,提供价格较高的商品或服务,反之,提供的商品或服务价格较为低廉,最终实现对不同消费者的定价差别化。目前学术界和媒体对于大数据“杀熟”现象的讨论,主要集中在价格差别定价上,然而,结合电子商务的特点,可以发现这种杀熟现象不仅体现在价格差别定价上,相同价格基础上的质量差异、服务差异都可能成为商家平台杀熟的对象。本文的主要贡献有以下几点:(1)大数据杀熟对抗技术研究:本文详细研究如何利用现有技术对抗大数据“杀熟”现象;互联网商业公司通过不同的手段收集用户行为偏好隐私,利用自己掌握的用户行为偏好数据为消费者构建用户画像,通过用户画像在消费者不知情的情况下推荐商品或服务,以此为基础,详细总结了文章的研究目标和具体工作,这部分首先研究了Web相关技术、Python编程语言,以Web服务为基础,利用Python语言简洁,易上手的特点以及它丰富的第三方库,为本文系统开发和功能实现提供了技术支持。然后分析了Python编程语言中常见的框架并与Java常用框架进行了对比,发现Python语言中Django框架具有全自动化的管理后台,应用到本文系统可以使开发更加方便。最后研究了网络爬虫技术,利用简洁的爬虫代码将团购网站的信息爬取并保存,作为系统的数据来源。综合Python在系统开发以及数据处理方面的优势,最终实现了大数据杀熟对抗系统。(2)大数据杀熟对抗系统的设计与实现:本文设计并实现一个基于Python语言的大数据杀熟对抗系统,杀熟系统可以代替消费者购买商品或服务,主要实现了如下功能:数据获取及过滤功能、用户登录功能、商品搜索功能、商品下单功能、自动清除Cookies功能以及随机浏览和模拟订单的功能。系统爬取网站商品信息,并对其进行预处理操作,然后供用户搜索,系统代替消费者购买商品,使互联网平台方无法直接接触到用户的信息,然后通过随机浏览和模拟订单的操作,混淆平台方对用户浏览记录和购买记录的数据收集,然后在用户退出后清除掉缓存的Cookies信息,通过这一系列的操作是互联网平台方无法获取到准确的用户行为信息,模糊互联网平台方对消费者用户画像的构建,以此达到对抗大数据杀熟的目的。
【学位授予单位】:曲阜师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP311.13
【图文】:

画像,行为偏好,消费者,目标消费者


图 1-1 大数据杀熟上 APP 都要求开放的位置授权来举例: APP 用户大概的活动范围和活动时间,以及活动方就可以通过已知的算法分析推断出用户的家夜以后一直到早上这段时间内待的时间最久的PP 通过短信获取你邻居和同事的信息数据,就能,APP 就能轻松地评估出该用户的消费能力。A画像,以此为用户划分等级来判断用户对价格的接析的核心是如何利用数据构建用户画像,许多互用户行为偏好数据一直都十分卖力,以现在的某户画像的平台。首先,构建用户画像的初衷是利的个性化服务和商品,一般的推荐算法有“根据荐和目标消费者特征相似消费者喜好的产品”这息、订单记录、行为偏好等来推测消费者的喜好

视图,脉络,框架,客户端


第 2 章 大数据杀熟对抗技术研究择可能是一个问题,因为一般来说,他们对 web 框架的选择会限制他们的选择,反之亦然……相比之下,尽管Java具有同样多的Web应用框架,API 使得应用任何 JavaWeb 应用程序框架编写的应用程序可以运行在支何 Web 服务器中[17]。(2)Django 框架Django 是一个基于 Python 的免费开源 Web 框架,遵循模型-视图template, MVT)体系结构模式。Django 的主要目标是简化复杂的数据库该框架强调组件的可重用性和“可插拔性”、更少的代码、低耦合、快速复自己”的原则。Django 的配置系统允许将第三方代码插入到常规项目可重用的应用程序约定。超过 2500 个包可用来扩展框架的原始行为,为的问题提供解决方案:注册、搜索、API 提供和使用、CMS 等[16]。客户端、Web 服务器、Web 框架之间的关系如图 2-1 所示:Web 服务应用程

最终用户,存储库


爬虫正在执行网站存档,它会在运行时复制时 web 上那样查看、读取和导航的方式存储于存储和管理 web 页面的集合。存储库只储。存储库类似于存储数据的任何其他系统要数据库系统提供的所有功能。存储库存储味着爬虫在给定的时间内只能下载有限数量序。高变化率意味着页面可能已经被更新甚的数量也使得 web 爬虫程序很难避免检索URL)参数组合,其中只有很小的一部分将实(2)爬虫技术原理爬虫下载网页的内容和数据为搜索引擎疑问的表明了网络爬虫在搜索引擎中的重要含的内容还有超链接信息。利用网页中的超页。因为爬虫系统的采集过程看起来像爬虫网络爬虫系统或者网络蜘蛛系统[26]。互联网

【相似文献】

中国期刊全文数据库 前10条

1 张立新;;互联网平台用工劳动关系问题研究[J];中国工运;2019年07期

2 李君;邱君降;柳杨;窦克勤;成雨;刘帅;文莎;;工业互联网平台评价指标体系构建与应用研究[J];中国科技论坛;2018年12期

3 ;分析阿里工业互联网平台[J];中国科技信息;2018年24期

4 尚偌男;张俊;;浅析互联网平台中的2.5D插画设计[J];艺术教育;2018年23期

5 许亚倩;;加快发展我国工业互联网平台势在必行[J];网络安全和信息化;2018年12期

6 王岳;;建设共生型工业互联网平台生态[J];中国工业和信息化;2018年12期

7 袁晓庆;;工业富联离建成跨行业跨领域工业互联网平台还有多远?[J];互联网经济;2018年12期

8 刘方丹;;互联网平台企业审计难点及对策——以九好集团为例[J];国际商务财会;2018年10期

9 刘群英;;互联网平台经济发展中存在的问题及解决探讨[J];时代金融;2018年33期

10 ;工业互联网平台建设有了新指南[J];领导决策信息;2018年36期

中国重要会议论文全文数据库 前10条

1 张丽华;;充分利用互联网平台 加强和创新企业党建工作[A];“决策论坛——管理科学与工程研究学术研讨会”论文集(上)[C];2016年

2 蔡正一;刘鹏;许庭洲;李增恒;;工业互联网平台在钢铁行业冷轧企业中的应用[A];中国计量协会冶金分会2017年会论文集[C];2017年

3 ;大规模风电场纳入互联网平台实时补贴范围[A];风能产业(2016年第3期 总第80期)[C];2016年

4 郎云文;;“浪潮云”平台正式上线 面向河北发放5000万元服务券[A];对接京津——生态优先 绿色发展论文集[C];2018年

5 叶兵;;标准共建 开源共赢——平台助力品质服务[A];2018中国房地产经纪年会论文集[C];2018年

6 罗方妍;;浅议电子商务平台在文创营销创新中的运用——韶山毛泽东同志纪念馆“天下韶山”旅游服务平台建设[A];博物馆学文集.12[C];2017年

7 李磊磊;刘沛谣;;“罐罐”经济规划——以基于互联网平台的大学生智能理财项目[A];劳动保障研究(2018年第1辑)[C];2018年

8 王彬;;关于机器人理财服务模式的分析及展望[A];创新与发展:中国证券业2016年论文集[C];2017年

9 ;中期协挂牌首批全国证券期货投资者教育基地[A];第十届中国期货分析师论坛专刊[C];2016年

10 周旋;张乐乐;;从数字云南转向智慧云南——智慧城市发展[A];第六届云南省科协学术年会暨红河流域发展论坛论文集——专题二:滇南中心智慧城市建设[C];2016年

中国重要报纸全文数据库 前10条

1 本报记者 潘昶安;互联网平台获准兼业卖保险[N];中国证券报;2019年

2 记者 张华桥;工业互联网平台再添“新丁”[N];东莞日报;2019年

3 本报记者 葛星星;工业互联网平台赋能企业数字化转型[N];台州日报;2019年

4 布轩;2019年产业互联与数字经济大会暨第二届工业互联网平台创新发展大会举办[N];人民邮电;2019年

5 用友高级副总裁 王健;用友精智工业互联网平台赋能水泥行业[N];人民邮电;2019年

6 ;开创工业互联网平台发展新格局[N];人民邮电;2019年

7 中国工业报 周宝冰;龙小昂:工业互联网平台脱颖而出的两大要素[N];中国工业报;2019年

8 本报记者 张力 实习记者 何健;张黎刚的野心与理智[N];经济观察报;2014年

9 本报记者 胡群;搭建互联网平台 中融信托布局流转市场[N];经济观察报;2015年

10 中国工业报 周宝冰;需求牵引 工业互联网平台应用走向务实[N];中国工业报;2019年

中国博士学位论文全文数据库 前9条

1 周颖;基于互联网平台的PCOSAct项目管理和质量控制[D];黑龙江中医药大学;2015年

2 马蔷;互联网平台企业竞合战略选择的多案例研究[D];吉林大学;2017年

3 王维国;基于双边市场的移动互联网平台所有权的比较研究[D];北京邮电大学;2013年

4 蔡利军;基于互联网平台的分布式创新研究[D];武汉大学;2010年

5 傅瑜;中国互联网平台企业竞争策略与市场结构研究[D];暨南大学;2013年

6 王节祥;互联网平台企业的边界选择与开放度治理研究:平台二重性视角[D];浙江大学;2017年

7 刘怡;观众登场:美国互联网内容生产与消费融合研究[D];华东师范大学;2012年

8 瞿旭晟;互联网平台上的知识生产[D];复旦大学;2010年

9 Khalid Rafique(卡利德);[D];北京邮电大学;2012年

中国硕士学位论文全文数据库 前10条

1 程芳洁;债务结构对互联网平台企业经营绩效的影响研究[D];山西财经大学;2019年

2 刘慧;大数据杀熟及其对抗技术研究[D];曲阜师范大学;2019年

3 庞文锵;互联网平台竞争的动态演化研究[D];武汉理工大学;2018年

4 胡天伊;互联网平台经济中企业劳动关系认定研究[D];兰州大学;2019年

5 孙小文;互联网平台垄断法律规制研究[D];郑州大学;2019年

6 龚晓菲;工业互联网平台数据的异常检测研究[D];北京邮电大学;2019年

7 王霄阳;传统媒体人转型互联网平台的职业价值研究[D];山东师范大学;2019年

8 曹珑;互联网平台搭售的竞争效应研究[D];山东大学;2019年

9 贺慧明;互联网平台企业发展路径研究[D];郑州大学;2019年

10 宋晨赫;互联网平台经济相关市场的界定研究[D];吉林大学;2019年



本文编号:2812167

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2812167.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户43322***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com