基于两种不同构图方法的半监督分类算法研究
本文关键词:基于两种不同构图方法的半监督分类算法研究,由笔耕文化传播整理发布。
【摘要】:在信息技术飞速发展的带动下,机器学习领域中的半监督学习自从产生便不断发展壮大,在丰富了数据挖掘、统计研究等相关领域的同时,也为其他学科实现快速发展提供了更好的机遇和更多的可能。伴随着“互联网+”时代的到来,在这样的环境下,大量的数据中隐含着的信息不断被挖掘利用,创造新的价值。基于图的半监督学习凭借其直观性也逐渐被更多的学者所研究和使用。利用样本集构图作为基于图的半监督学习的重要构成环节,往往决定着学习算法的效率高低,合适的构图能够带来更高的分类准确率。当下基于图的学习方法研究中采用的构图方法大多都是K近邻构图法,对于其他的构图方法的研究却相对较少。同时由于常用的构图方法在解决样本数据的连接边的对称性和连通性上存在一定的不足,因而对使用什么样的构图方法能够更好的提高基于图的半监督学习效率的问题研究是十分迫切和必要的。本文的主要研究内容如下:⑴通过查阅大量的国内外文献资料,结合国内外的研究现状和具有代表性的案例分析,对基于图的半监督学习的内涵和特点做了较为全面完整的综述,并概述了基于图的半监督学习方法的基本理论及技术;⑵为了克服半监督分类算法中常用的k近邻图构图方法不能同时满足边的对称性和图的连通性的不足,本文将最小最大邻域阶方法应用到半监督分类算法的构图过程中,提出了基于最小最大邻域阶的半监督分类算法(KMMLGC算法)。通过对随机样本数据和UCI数据集上的数据的仿真实验,表明了KMMLGC算法的有效性;⑶自然最近邻构图法是一种自适应的、无参数的搜索样本最近邻的方法。本文将自然最近邻构图方式应用到半监督算法的构图过程中,提出了基于自然最近邻的半监督分类算法(3NLGC算法),随机样本集和UCI数据集上的仿真实验表明了3NLGC算法的有效性,同时针对3NLGC算法和KMMLGC算法在UCI数据集上进行了对比实验,实验表明3N算法的效率更高。⑷最后,对本文所做的研究工作做了总结,提出了现阶段研究存在的不足,并对后续研究做出展望。
【关键词】:半监督学习 近邻图 自然最近邻 基于图的半监督学习
【学位授予单位】:重庆师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 1 绪论10-20
- 1.1 论文研究背景及依据10-15
- 1.2 基于图的学习的研究现状15-17
- 1.2.1 国外研究现状分析15-16
- 1.2.2 国内研究现状分析16-17
- 1.3 研究内容及意义17-18
- 1.3.1 研究内容17-18
- 1.3.2 研究意义与目的18
- 1.4 论文的组织结构18-20
- 2 基于图的半监督分类20-33
- 2.1 图的拉普拉斯矩阵的相关知识20-25
- 2.1.1 图的拉普拉斯矩阵的定义20-22
- 2.1.2 拉普拉斯矩阵的性质简介22
- 2.1.3 拉普拉斯算子22-24
- 2.1.4 正则拉普拉斯矩阵及性质24-25
- 2.2 基于图模型的学习算法25-27
- 2.2.1 图的构造26-27
- 2.2.2 图的正则化框架27
- 2.3 几种基于图的半监督分类方法27-30
- 2.3.1 标签传播算法27-28
- 2.3.2 图的最小分割方法28-29
- 2.3.3 调和函数方法29
- 2.3.4 局部与全局一致性方法29-30
- 2.4 基于k近邻图的半监督学习算法30-32
- 2.4.1 算法描述31
- 2.4.2 收敛性证明31-32
- 2.5 本章小结32-33
- 3 基于最小最大邻域阶构图法的标签传播算法33-42
- 3.1 最小最大邻域阶构图法问题提出的背景33-34
- 3.2 最大最小邻域阶构图方法34-36
- 3.2.1 基本概念34
- 3.2.2 问题描述34-35
- 3.2.3 构图方法35-36
- 3.3 基于最大最小邻域阶构图法的局部全局一致性算法步骤36-37
- 3.4 实验结果及分析37-41
- 3.4.1 随机实验结果及分析37-38
- 3.4.2 UCI数据集实验结果及分析38-41
- 3.5 本章小结41-42
- 4 基于自然最近邻构图法的标签传播算法42-53
- 4.1 自然最近邻42-47
- 4.1.1 基本概念42-43
- 4.1.2 自然最近邻域搜索算法描述43-45
- 4.1.3 自然最近邻域图45-47
- 4.2 基于自然最近邻构图法的局部全局一致性算法47-48
- 4.3 实验结果及分析48-52
- 4.3.1 随机实验结果及分析48-49
- 4.3.2 UCI数据集实验结果及分析49-52
- 4.4 本章小结52-53
- 5 总结与展望53-55
- 5.1 论文分析与总结53
- 5.2 研究工作总结53-54
- 5.3 研究的局限性及展望54-55
- 参考文献55-59
- 附录:作者攻读硕士学位期间发表论文及科研情况59-60
- 致谢60
【相似文献】
中国期刊全文数据库 前10条
1 张桂榕;;反向最近邻查询研究综述[J];电脑知识与技术;2011年28期
2 周屹;;不确定对象的反向最近邻查询研究[J];黑龙江工程学院学报(自然科学版);2012年04期
3 刘永山,薄树奎,张强,郝忠孝;多对象的最近邻查询[J];计算机工程;2004年11期
4 郝忠孝;刘永山;;空间对象的反最近邻查询[J];计算机科学;2005年11期
5 王淼;郝忠孝;;不确定性对象的反向最近邻查询[J];计算机工程;2010年10期
6 张旭;何向南;金澈清;周傲英;;面向不确定图的k最近邻查询[J];计算机研究与发展;2011年10期
7 杨泽雪;郝忠孝;;空间数据库中的障碍反向最近邻查询[J];计算机工程与应用;2011年34期
8 王丹丹;郝忠孝;;道路网络中的多类型K最近邻查询[J];计算机工程与应用;2012年03期
9 邓瑾;周梅;;基于R树及其变种的最近邻查询研究[J];现代计算机;2013年09期
10 朱婧;;平面中点对一般多边形的最近邻查询研究[J];科技通报;2014年01期
中国重要会议论文全文数据库 前10条
1 张晓峰;王丽珍;肖清;赵丽红;;基于概念划分的连续最近邻查询研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 管猛;张剡;柏文阳;;基于地表的连续可见最近邻查询方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 陈璐;高云君;柳晴;陈刚;;受限相互最近邻查询处理[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
4 盛梅红;沙朝锋;宫学庆;嵇晓;周傲英;;道路网络环境中的多对象最近邻查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 刘月清;章勇;;一种改进的动态最近邻聚类算法[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
6 李传文;谷峪;李芳芳;于戈;;一种障碍空间中不确定对象的连续最近邻查询方法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
7 刘星毅;;基于欧式距离的最近邻改进算法[A];广西计算机学会2010年学术年会论文集[C];2010年
8 刘先康;梁菁;任杰;蒋光庆;;修正最近邻模糊分类算法在舰船目标识别中的应用[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
9 刘俊岭;孙焕良;;多维度量空间中发现相互kNN(英文)[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
10 余小高;;P2P环境中k最近邻搜索算法研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
中国博士学位论文全文数据库 前8条
1 魏本昌;基于内容的大规模图像检索技术研究[D];华中科技大学;2015年
2 杨泽雪;空间连接及最近邻变体查询研究[D];哈尔滨理工大学;2014年
3 孙冬璞;时空数据库多类型最近邻查询的研究[D];哈尔滨理工大学;2010年
4 王建峰;基于哈希的最近邻查找[D];中国科学技术大学;2015年
5 张得天;时间依赖路网高效k最近邻查询混搭机制的研究[D];中国科学技术大学;2014年
6 杜钦生;高维空间的K最近邻查询及连接问题研究[D];吉林大学;2015年
7 张军旗;支持最近邻查找的高维空间索引[D];复旦大学;2007年
8 李艳红;路网中移动对象最近邻及反向最近邻查询处理研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨根茂;基于哈希加速的近似最近邻检索算法研究[D];浙江大学;2015年
2 原s,
本文编号:400156
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/400156.html