当前位置:主页 > 管理论文 > 统计学论文 >

互联网背景下基于集成半监督学习的用户对抗性识别

发布时间:2020-04-23 00:45
【摘要】:移动互联网的快速发展给统计学习的研究带来了全新的挑战,该背景下由智能手机所采集的海量数据具有三个特点,一是高维度,二是弱相关,三是海量的无标签样本点与有限的有标签样本点相结合。针对这一些问题,论文梳理了高维统计分类算法的几个主要类型,并结合特征和目标之间的弱相关特点,着重介绍了一种最新的能够解决弱相关特征降维问题的非参数特征扩充及选择算法(Feature Augmentation via Nonparametrics and Selection,FANS)。论文基于FANS算法和带有一范数惩罚项的Logistic回归算法,构建一种新的集成半监督学习算法:对抗性用户识别算法。该方法的核心机制是,利用两种算法的分歧性,以及FANS在冷启动上的核心优势,序贯训练两个算法,它们都会从无标签样本组中挑选置信度最高的样本点,赋予其相应的标签,加入到对方的训练数据集中。从半监督学习的角度而言,向初始训练集中添加伪标注数据,必然会引入误标注噪音,那么必然就存在两个相互矛盾的目标,一方面是希望添加更多的伪标注数据,扩充训练集,而另一方面则是希望添加更少的伪标注数据,以减少引入的噪音水平。半监督学习算法方面的文献普遍没有解决这一矛盾,而论文发掘历史文献,发现80年代所提出的基于训练集中有噪音的情况下的统计学习方法——噪音学习理论可以有效解决这一问题。基于噪音学习理论,可以评估每一个轮次添加的伪标签样本组的准确率是否超过可容忍的下界,进而为超参数的设定给出指导性的建议。最终,论文实现了一个可以对高维弱相关且具有海量无标签样本的数据集进行学习的分类算法——对抗性用户识别算法,该算法的优点是:一,可以提高总体的分类精确性;二,可以从无标签样本组中识别出高置信样本组,并给出该组样本分类准确率的下界;三,可以根据高置信组规模是否收敛,给出超参数调节策略。
【图文】:

创新点,高维,准确率,论文


图1.1文章框架结构逡逑1.5创新之处逡逑论文在整个研宄过程中有三个核心创新点,第一,引入了一种较新的高维分类算S算法,该算法的在高置信区域具有极高的准确率,而且它与Logistic回归给出的

神经网络结构,惩罚项,范数,误差函数


=1式的Logistic回归会受到“维度灾难”的困扰,难以产生特征排除,,给出更有效的学习模型,需要在误差函数中添加罚项按照形式的不同可以分为一范数惩罚项和二范数惩罚项gminw邋^/3wTw邋+邋Xil=il0g[exp(-yi(XiM^邋+邋c))邋+邋l]逡逑minw邋^Wwl^邋+邋Hf=1l0g[exp(-yj(XjM/邋+邋c))邋+邋l]逡逑惩罚项可以起到系数收缩的作用,但是并不能将某一些无效所以在高维问题中适合使用带有一范数惩罚项的Logistic在误差函数中增加了一范数惩罚项之后,误差函数不可微,适用的求解方法包括坐标上升算法一种变体“SAGA”算法。逡逑2.邋3带DropOut层的稀疏神经网络分类算法逡逑
【学位授予单位】:天津财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C819

【相似文献】

相关期刊论文 前10条

1 屠恩美;杨杰;;半监督学习理论及其研究进展概述[J];上海交通大学学报;2018年10期

2 唐晓亮;韩敏;;一种基于极端学习机的半监督学习方法[J];大连理工大学学报;2010年05期

3 张晨光;李玉擰;;哈希图半监督学习方法及其在图像分割中的应用[J];自动化学报;2010年11期

4 张燕;张晨光;张夏欢;;平衡化图半监督学习方法[J];系统科学与数学;2016年08期

5 李聪;黄俊爽;朱明明;李相俭;;初探半监督学习在脑白质纤维束辨识中的应用[J];科技信息;2010年10期

6 周志华;;半监督学习专刊前言[J];软件学报;2008年11期

7 姜震;詹永照;;基于差异半监督学习的相关理论分析[J];模式识别与人工智能;2014年10期

8 张建欣;;基于半监督学习的在线评论挖掘应用[J];计算机光盘软件与应用;2012年20期

9 王晓波;;基于可信点的联合半监督学习[J];哈尔滨商业大学学报(自然科学版);2016年01期

10 索南楞智;刘静静;刘萍;;结合图模型和分层查询的半监督学习方法[J];计算机工程与设计;2017年05期

相关会议论文 前10条

1 赵玲玲;周水生;王雪岩;;基于集成算法的半监督学习[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

2 陈耀东;王挺;陈火旺;;半监督学习和主动学习相结合的浅层语义分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

3 吴龙飞;孙浩;计科峰;;基于集成映射的半监督图像分类方法[A];第八届全国信号和智能信息处理与应用学术会议会刊[C];2014年

4 滑文强;王爽;;基于协同学习的半监督极化SAR分类[A];第三届高分辨率对地观测学术年会(天基对地观测技术分会)优秀论文集[C];2014年

5 林良宪;利德江;蔡孟璇;邱政贤;;针对小样本分类的半监督式学习法[A];第25届全国灰色系统会议论文集[C];2014年

6 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年

7 谢永芳;蒋有为;唐明珠;;一种基于数据剪辑的半监督最邻近分类算法[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

8 孙涛;刘静;刘青山;卢汉清;;半监督谱判别式分析[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

9 何正焱;王厚峰;;商品品牌名称挖掘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

10 蒋翠清;王齐林;刘士喜;丁勇;刘尧;;中文社会媒体环境下半监督学习的汽车缺陷识别方法[A];第十六届中国管理科学学术年会论文集[C];2014年

相关博士学位论文 前10条

1 王绍凯;属性网络的半监督学习方法研究[D];哈尔滨工业大学;2018年

2 唐晓亮;基于神经网络的半监督学习方法研究[D];大连理工大学;2009年

3 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年

4 孙博良;在线半监督学习理论、算法与应用研究[D];国防科学技术大学;2014年

5 吴梦麟;基于半监督学习的医学图像检索研究[D];南京理工大学;2015年

6 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年

7 黄鹏;基于广义半监督学习方法的软件质量预测研究[D];上海交通大学;2010年

8 杨晨雪;图像特征学习方法与应用研究[D];电子科技大学;2016年

9 姜震;基于差异的半监督学习中有关算法和理论研究[D];复旦大学;2012年

10 吕佳;基于局部学习的半监督分类问题研究[D];内蒙古大学;2012年

相关硕士学位论文 前10条

1 张伟健;互联网背景下基于集成半监督学习的用户对抗性识别[D];天津财经大学;2018年

2 吴春叶;基于半监督学习的观点挖掘算法的研究与实现[D];北京邮电大学;2019年

3 陈子岚;基于广义可加模型的半监督学习方法[D];厦门大学;2018年

4 祝宏玉;基于不确定性的代价敏感半监督学习[D];深圳大学;2018年

5 董豪晨;复杂半监督学习场景的研究[D];南京大学;2019年

6 金兰依;基于半监督阶梯网络的肝脏CT影像分割方法[D];吉林大学;2018年

7 贾晓亮;基于半监督学习模型的不文明微博帖识别方法研究[D];华中师范大学;2018年

8 孙旭明;基于半监督学习的文本分类关键技术研究[D];哈尔滨工业大学;2018年

9 符春晓;基于阶梯网络的半监督深度学习方法及其应用研究[D];国防科学技术大学;2016年

10 梁莹;基于深度半监督学习的极化SAR图像地物分类方法[D];西安电子科技大学;2018年



本文编号:2637163

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2637163.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b3836***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com