带标签和/或无标签数据综合利用的模式分类新方法研究

发布时间:2021-04-18 17:03
  模式分类是机器学习的一个重要研究分支。传统模式分类包括监督分类和无监督分类两种方法,其训练数据集要么是带标签数据,要么是无标签数据。随着新应用的不断出现,训练数据集中同时包含带标签数据和无标签数据,无标签数据数量非常多且获得新的无标签数据非常容易代价低廉,而带标签数据数量非常少且获得新的带标签数据非常困难代价昂贵;并且还出现了一种新现象,无标签数据和带标签数据来自不同但相关的领域。针对该现象,本文以最小包含球、核向量机、特征扩维和共享隐空间等理论为指导思想,结合支持向量机,针对监督分类、半监督分类和迁移分类三种不同研究场景,提出了几种带标签和/或无标签数据综合利用的模式分类新方法,主要研究成果如下:1)针对监督分类场景,将以稀有带标签数据为训练数据的分类问题应用到推荐系统中,提出了针对异质空间大数据相似性问题的推荐算法及其快速算法,算法本质上是基于监督分类模型的个性化推荐算法。具体来说,该算法将传统推荐方法和最小包含球、核向量机等理论相结合,以支持向量机理论为基础,将传统推荐方法转化为中心约束的最小包含球问题,从而使其具备大样本快速处理能力。实验中将所提方法应用到电影推荐系统中,验证了... 

【文章来源】:江南大学江苏省 211工程院校 教育部直属院校

【文章页数】:136 页

【学位级别】:博士

【部分图文】:

带标签和/或无标签数据综合利用的模式分类新方法研究


3种算法在数据集MovieLens100k上推荐性能NDCG@k(k=1,2,...,10)的变化比较

参数λ,算法


从图2-3可以看出,当λ 取值为2时 算法CSAL-CVM取得最优推荐性能。图2-2. 参数λ 对算法CSAL-MEB的推荐性能的影响Fig 2-2. The recommendation curve of parameter λ on CSAL-MEB

参数λ,算法,法本质,带标签


图2-3.参数λ 对算法CSAL-CVM的推荐性能的影响-3. The recommendation curve of parameter λ on CSA有带标签数据为训练数据的分类问题应用到推 数 据 相 似 性 问 题 的 推 荐 算 法 CSAL-ME法本质上是基于监督分类模型的个性化推荐L的良好性能,而CSAL-CVM算法良好的时间能获得相对快速的决策。实验中的推荐性能及然CSAL-CVM仍然需对推荐系统面临的诸如究,即如何处理新用户和新项目问题,这将是

【参考文献】:
期刊论文
[1]基于隐空间的低秩稀疏子空间聚类[J]. 刘建华.  西北师范大学学报(自然科学版). 2015(03)
[2]基于跨领域主动学习的图像分类方法[J]. 邵忻.  计算机应用. 2014(04)
[3]大样本多源域与小目标域的跨领域快速分类学习[J]. 顾鑫,王士同.  计算机研究与发展. 2014(03)
[4]基于多源的跨领域数据分类快速新算法[J]. 顾鑫,王士同,许敏.  自动化学报. 2014(03)
[5]融合异构特征的子空间迁移学习算法[J]. 张景祥,王士同,邓赵红,蒋亦樟,李奕.  自动化学报. 2014(02)
[6]基于隐特征提取和CRF模型的中文词义消歧[J]. 黄莹,陈笑蓉.  贵州大学学报(自然科学版). 2013(06)
[7]核分布一致局部领域适应学习[J]. 陶剑文,王士同.  自动化学报. 2013(08)
[8]基于隐特征空间的极限学习机模型选择[J]. 毛文涛,赵中堂,贺欢欢.  计算机应用. 2013(06)
[9]基于半监督高斯混合模型核的支持向量机分类算法[J]. 陶新民,曹盼东,宋少宇,付丹丹.  信息与控制. 2013(01)
[10]一种基于高斯隐变量模型的分类算法[J]. 王秀美,高新波,李洁.  计算机学报. 2012(12)

博士论文
[1]多视度量和回归学习方法及应用研究[D]. 翟德明.哈尔滨工业大学 2014

硕士论文
[1]基于NMF的文本聚类方法及应用研究[D]. 张焱凯.江南大学 2015
[2]基于单源及多源的域适应算法研究[D]. 时红垒.华东师范大学 2015



本文编号:3145843

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3145843.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户706bd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com