基于半监督学习的情感分类方法研究
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图2初始标注样本5%时不同半肚$分类方法情启分类性筑比较
3期高伟等:基于集成学习的半监督情感分类方法研究算法流程参见3.2.1节。(3)LabelPropagation:标签传播算法,具体算法流程参见3.2.2节。(4)我们的方法:对每个子半监督学习算法进行一致性标签融合,选择标注一致的未标注样本更新初始标注样本,即本文重点提出的方法....
图2-1向量空间模型图??文档的向量空间表示的主要任务是为特征向量找到合适的编码
?.)?=?(&.?:wu,...,g:ww.),其中;表示文档中的特征,w表示特征对应的权重。在??^维向量空间中,用特征项来代表坐标系,特征权重(%,,...,>〇代表??坐标值,因此,文档d可以由《维数值特征向量OpWj,...,w?)表示,如图2-1所??7Jn?〇??,....
图2-2?SVM基本原理图??假设给定训练样本集合T?=?%),(x2,%),...,(%,}^)丨,其中x,+?ef,??
SVM是一种基于统计学习理论的分类技术,由Cortes和\^口11&[41]于1995??年提出。它的基本思想是试图通过最大化最近邻训练样本与分离超平面的几何间??隔找到最佳分离超平面。可以通过下图2-2对SVM的算法原理有一个基本认识,??图中正方形代表正例样本,圆圈代表负例样....
图3-1初始比例为5%时各半监督情感分类算法效果对比图??-
Stratified?Co-training:本章提出的算法,其算法流程参考算法3-2,同样设置??子空间个数为m=2。??图3-1给出了在三种语料下各种半监督学习算法的性能对比。具体实验时,??初始标注样本的比例为5%,测试数据的比例为20%,剩下的为未标注样本。??〇.8?n....
本文编号:3905693
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3905693.html