当前位置:主页 > 科技论文 > 自动化论文 >

层次性多示例多标记学习算法的研究

发布时间:2021-01-03 16:58
  多示例多标记学习是机器学习中解决实际问题时常见的学习框架。在过去,学习对象由一个示例(即属性向量)描述且对应于一个类别标记,但是随着问题的复杂性和事物的多变性,一个样本可以由多个示例组成,同时该样本属于多个类别标记,这种问题的学习就是多示例多标记学习框架。随着科技的飞速发展,大数据时代日益逼近,深入研究多示例多标记学习算法具有很大的现实意义。现实很多多示例多标记学习应用中,标记之间是有关联的,并且很多应用场景下,标记呈现层次性树(TREE)结构或者有向无环图(DAG,Directed Acyclic Graph)结构。但是目前对多示例多标记研究时往往忽略了标记之间的层次依赖性,迫切需要开发一种可以考虑这种层次性标记关系的全新多示例多标记学习方法。所以本论文将提出两种基于层次性结构的多示例多标记学习算法,即基于树结构、有向无环图结构的多示例多标记学习算法。算法充分考虑了标记之间的层次性结构,提高了算法的效率,并扩大了多示例多标记学习的应用范围。本文把算法应用于G蛋白偶联受体的生物学功能预测,由于GO(Gene Ontology)标记通常可表示为两种层次性结构,即树和有向无环图结构,所以在... 

【文章来源】:南京邮电大学江苏省

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

层次性多示例多标记学习算法的研究


多示例多标记(MIML)学习样例

学习模型,图片,示例,多标记


多示例多标记学习框架的提出和定义多示例多标记学习框架的提出是为了解决对象具有多义性的问题,因为这种多重含义的对象通常具有难以理解的内涵,所以如果只用一个示例特征向量来描述,那么未免太过简化。这也使得在特征描述的时候丢失掉了重要的信息,那么之后在进行模型训练时将带来更大的挑战和困难。举些例子来说,在图像分类问题中,如图 2.1,一幅图片往往可以分割为多个具有特定含义且相对独立的部分,我们用一个示例来描述每一个部分,这样,多个示例组成的集合就可以描述一副图片,与此同时,该副图像可能隶属于多个类别标记。在文档分类中,根据其各部分表达含义的不同,将文档划分为若干部分,每个部分用一个示例来描述,这样,一个文档就可以表示成多个示例的集合,而该文档在从不同的角度进行思考时,可能同时隶属于多个类别标记;在生物信息学中,基因或者蛋白质的每个特征可以由一个示例进行表示,而基因或者蛋白质本身往往隶属于多个生物学功能。

方案,监督学习,多标记,假设数据


输出空间的映射,这种映射可以表示为 :2 → 2时映射函数可以表示为 : × 2 → 1, + ( ) = ( ),此时 = ( ), :2 →假设数据样本为 ,并且 的概念类别标记集合为Y = ( ( )) 学习是多示例学习和多标记学习的具体化实例,监督学习问题来解决。监督学习概论中是一个示例: × → 1, + 1 ,那么可以通过以下公式习问题,即: ( ) = , = +1

【参考文献】:
期刊论文
[1]数据挖掘综述[J]. 王光宏,蒋平.  同济大学学报(自然科学版). 2004(02)



本文编号:2955166

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2955166.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户40de8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com