半监督排序的若干关键问题研究
发布时间:2019-09-18 02:48
【摘要】:排序是信息检索领域的核心问题,在众多应用问题如搜索引擎、协同过滤、药物发现与生物信息学中发挥着越来越重要的作用。排序旨在根据给定的训练样本,返回一个反映样本序关系的列表。由于当前机器学习领域中支持向量机算法获得的巨大成功,学习已经成为解决排序问题的最重要的方法,排序学习成为了机器学习领域中继分类与回归之后涌现出来的学习问题与研究热点。 然而,目前对排序学习的研究主要集中在监督情形。而在现实应用问题中,未标记样本的获取比标记样本更廉价也更容易,我们往往面对的是少量标记样本和大量未标记样本共存的情形—即半监督排序学习问题。因此本论文围绕半监督排序中的特征提取与模型设计分析两个环节展开研究,主要贡献如下: 1.针对当前半监督排序模型没有考虑样本标记的值或样本标记的差分模度这一问题,提出了两个半监督排序模型:(a)基于图的直推排序模型。我们基于图相似性矩阵建立了半监督排序模型,导出了闭式解,用其可得到未标记样本的评分。(b)基于图的保留模度半监督排序模型。利用最小二乘排序损失,我们证明了表示定理并推导出了该模型的闭式解,给出了推广误差的上界,证明了其推广性能与图的相似性矩阵之间有密切的关系。在推荐任务与量化构效关系分析中的实验结果表明,该算法比许多主流的排序学习算法具有更好的性能。 2.针对当前半监督排序中可使用的核函数类型较少并且没有考虑非线性特征的正交性这一问题,构建了两种不同的用于向量型输入的Legendre核函数:(a)基于正交Legendre多项式的正交Legendre核函数。(b)基于广义Legendre多项式的广义Legendre核函数。这些核函数确定的非线性映射的各个分量之间是彼此正交的,因此可以去除数据中的冗余。在一些公共数据集上的实验结果表明,与已有的Chebyshev正交多项式核函数相比,使用了广义Legendre核函数的支持向量机算法往往具有较少的支持向量、较高的稳定性与更好的推广性能。 3.针对可应用于半监督排序的常用特征提取方法—线性判别分析在现实应用中碰到的小样本容量问题,提出了两种线性判别分析准则:(a)加权和判别分析准则。该准则中同时考虑了两种不同度量—类内散度与类间相似性,其优化模型的解最终归结为一个特征分解问题。因此加权和判别分析准则可以克服小样本容量问题、提取出任意数量的特征,并在一些标准人脸数据集上获得了较高的识别精度。(b)值域空间线性判别分析。它是一种两阶段判别准则,在第一阶段中将所有样本投影到类间散度矩阵的值域空间中,然后再实施传统的线性判别分析。与一些主流判别分析准则相比,该准则的识别精度具有可比性且计算效率较高。
【图文】:
x115阶正交Legendre核SVM在双螺旋线数据集上的分们使用的数据集可在加州大学欧文分校的机epository) [135]中下载。此处的图像分割数据集(I构成:砖墙(brickface)、天空(sky)、枝叶(folia
?RL数据集由40个人每人10幅不同图像一共400幅正面人脸图像构成,图像包含了姿态、光照和面部表情(挣眼/闭眼,微笑/不笑)等各方面的变化以及面部细节(戴眼镜/不戴眼镜)。所有的图像都是灰度图像并被紧贴人脸剪切到了92x112像素。为减小计算量,所有图像被进一步缩放到46x56像素。对每个人,我们随机选择6幅图像用于训练,,而剩下的4幅图像则被用于测试。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:O223
本文编号:2537252
【图文】:
x115阶正交Legendre核SVM在双螺旋线数据集上的分们使用的数据集可在加州大学欧文分校的机epository) [135]中下载。此处的图像分割数据集(I构成:砖墙(brickface)、天空(sky)、枝叶(folia
?RL数据集由40个人每人10幅不同图像一共400幅正面人脸图像构成,图像包含了姿态、光照和面部表情(挣眼/闭眼,微笑/不笑)等各方面的变化以及面部细节(戴眼镜/不戴眼镜)。所有的图像都是灰度图像并被紧贴人脸剪切到了92x112像素。为减小计算量,所有图像被进一步缩放到46x56像素。对每个人,我们随机选择6幅图像用于训练,,而剩下的4幅图像则被用于测试。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:O223
【参考文献】
相关期刊论文 前1条
1 刘青山,卢汉清,马颂德;综述人脸识别中的子空间方法[J];自动化学报;2003年06期
本文编号:2537252
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2537252.html