基于正交因子的非负矩阵分解的算法研究
发布时间:2020-08-01 14:42
【摘要】:非负矩阵分解主要研究将一个给定的非负矩阵分解为两个非负矩阵乘积的方法和策略。非负矩阵分解具有形式简单、解释性好、占据存储空间少等优点,因此在数据科学领域具有很大的应用潜力与研究价值。本文首先从几何的角度描述了非负矩阵分解的过程,并定义了矩阵非负分解中的关键概念:正交因子和缩放因子。分析发现,对于某些满足一定条件的非负矩阵,基于正交因子的矩阵分解算法可以高效地求解这些矩阵的非负分解问题。相比之前常用的投影非负分解方法,新方法通过寻找合适的正交因子来达到非负分解的目的,进而大大降低了每步迭代的计算复杂度。我们还对算法中正交因子的初值进行了分析,并给出了选取初值的策略。最后,我们通过数值实验评估了新算法的表现。实验显示,无论是计算速度方面,还是精确度方面,新算法都有更好的效果。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O151.21
【图文】:
Koochakzadeh等人在QMethodl::1中提出,非负矩阵分解问题可以只用正交因子作用逡逑于和f即可得到X的非负分解。但实验可以发现,对于很多存在稀疏非负分解的非逡逑负矩阵,采用Q邋Method方法求解其非负分解,会出现误差停止下降的情况,见图3.1。我逡逑13逡逑
CPUtime[6]逦CPUtime[s]逡逑图4.2左图为第一组实验,右图为第二组实验,OFnmf中Q初始值为g?。逡逑由图4.2和表4.2结果可以看出,在给定误差下限后,对于规模大小不同的数据,算法逡逑OFnmf降到给定误差下哏所需时间都比其他既有的算法少。这也说明算法OFnmf在速度逡逑22逡逑
CPUIime[a)逦CPUllme(s]逡逑图4.1左图为第一组实验,右图为第二组实验,OFnmf中Q初始值为逡逑到的误差都比其他既有的算法小。这说明算法OFnmf在分解的精确度上具有优势。同时,逡逑我们注意到由于{劮ǎ彦澹停澹簦瑁铮浜停希疲睿恚娑夹枰源纸獾姆歉壕卣螅亟衅嬉熘捣纸猓义险夤滔牧私隙嗍奔洌云涠杂Φ那咄汲鱿值媒贤怼8们樾卧冢毓婺=洗笫保儒义衔飨浴e义希矗保哺ㄎ蟛詈蟊冉喜煌惴ǖ氖奔溴义系谝蛔槭笛椋海礤澹藉澹担埃埃铄澹藉澹担埃埃颍剑保埃埃。保按问笛榈钠骄怠e义系诙槭笛椋海礤澹藉澹常埃埃埃铄澹藉澹
本文编号:2777596
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O151.21
【图文】:
Koochakzadeh等人在QMethodl::1中提出,非负矩阵分解问题可以只用正交因子作用逡逑于和f即可得到X的非负分解。但实验可以发现,对于很多存在稀疏非负分解的非逡逑负矩阵,采用Q邋Method方法求解其非负分解,会出现误差停止下降的情况,见图3.1。我逡逑13逡逑
CPUtime[6]逦CPUtime[s]逡逑图4.2左图为第一组实验,右图为第二组实验,OFnmf中Q初始值为g?。逡逑由图4.2和表4.2结果可以看出,在给定误差下限后,对于规模大小不同的数据,算法逡逑OFnmf降到给定误差下哏所需时间都比其他既有的算法少。这也说明算法OFnmf在速度逡逑22逡逑
CPUIime[a)逦CPUllme(s]逡逑图4.1左图为第一组实验,右图为第二组实验,OFnmf中Q初始值为逡逑到的误差都比其他既有的算法小。这说明算法OFnmf在分解的精确度上具有优势。同时,逡逑我们注意到由于{劮ǎ彦澹停澹簦瑁铮浜停希疲睿恚娑夹枰源纸獾姆歉壕卣螅亟衅嬉熘捣纸猓义险夤滔牧私隙嗍奔洌云涠杂Φ那咄汲鱿值媒贤怼8们樾卧冢毓婺=洗笫保儒义衔飨浴e义希矗保哺ㄎ蟛詈蟊冉喜煌惴ǖ氖奔溴义系谝蛔槭笛椋海礤澹藉澹担埃埃铄澹藉澹担埃埃颍剑保埃埃。保按问笛榈钠骄怠e义系诙槭笛椋海礤澹藉澹常埃埃埃铄澹藉澹
本文编号:2777596
本文链接:https://www.wllwen.com/kejilunwen/yysx/2777596.html