当前位置:主页 > 科技论文 > 数学论文 >

高维复杂数据网络与节点属性的统计推断

发布时间:2018-03-06 06:22

  本文选题:矩阵奇异值分解 切入点:Wilks 出处:《青岛大学》2017年硕士论文 论文类型:学位论文


【摘要】:本文首先研究两个相关关系矩阵(对称矩阵或非对称矩阵)之间的相关关系,给出预测并解决如下问题:网络间相关性检验以及高维网络中包含不可观测的潜变量结构问题。对网络(相关系数矩阵)进行矩阵奇异值分解(SVD)获取低秩因子(潜变量),对低秩因子构建Wilks’Lambda统计量以检验网络间的相关性。若检验显示存在显著线性关系,则对低秩因子构建线性回归模型。若检验结果显示非线性关系,采用非线性模型,并使用极大似然估计法对模型参数进行估计。获取待估低秩因子(潜变量)后,可使用矩阵奇异值分解等方法对低秩因子进行还原,进而可以对网络中缺失地相关关系进行填补,对潜在相关关系进行预测。其次,受正态分布下的精度矩阵相关性质对缺失值识别的启发,对一般连续型分布的样本通过高斯Copula模型转换至正态分布中以识别该分布下缺失值。通过该步预测,为之后的缺失值填补提供合理有效的判断和解释。并针对高维复杂数据的稀疏性、混合数据等特性分别引入逆回归模型,混合数据的潜变量高斯Copula模型等方法以解决相应的问题,为模型推广至高维复杂数据中提供理论支持。最后,通过数值模拟小样本下模型结构,通过对对称网络回归系数、缺失值填补、未知节点关系、以及非对称网络缺失值填补预测等四个实验模拟,发现各评价指标显示相较于对比方法,模型效果较好,且随着数据维度增加,模型效果更佳。在实证分析章节,对四个包括药物结构相似性、靶点蛋白序列相似性和药物与靶点相互作用的数据集进行分析,一致发现在相似性检验以及模型预测过程中均优于对比方法,尤其在降维过程中,降维效果显著。
[Abstract]:In this paper, we first study the correlation between two correlation matrices (symmetric matrix or asymmetric matrix). The following problems are given to predict and solve the following problems: the correlation test between networks and the structure of non-observable latent variables in high-dimensional networks. The low rank factors are obtained by matrix singular value decomposition (SVD) for the network (correlation coefficient matrix). For low rank factors, Wilks'Lambda statistics are constructed to test the correlation between networks. If the test shows a significant linear relationship, Then a linear regression model is constructed for low rank factors. If the test results show a nonlinear relationship, the nonlinear model is used and the parameters of the model are estimated by using the maximum likelihood estimation method. After obtaining the low rank factors (latent variables) to be estimated, The method of matrix singular value decomposition can be used to restore the low rank factor, and then the missing correlation can be filled, and the potential correlation can be predicted. Inspired by the correlation property of precision matrix under normal distribution, the samples of general continuous distribution are transformed to normal distribution by Gao Si Copula model to recognize the missing value under this distribution. It provides reasonable and effective judgment and explanation for filling the missing value, and introduces inverse regression model for the characteristics of high dimensional complex data such as sparsity, mixed data and so on. Gao Si Copula model of mixed data is used to solve the corresponding problems, which provides theoretical support for extending the model to high dimensional complex data. Finally, through numerical simulation of the model structure under small samples, the regression coefficient of symmetric network is obtained. Four experimental simulations, including missing value filling, unknown node relationship and asymmetric network missing value filling prediction, show that each evaluation index shows a better effect than the contrast method, and with the increase of data dimension, the model has a better effect. The model works better. In the empirical analysis chapter, four data sets including drug structural similarity, target protein sequence similarity and drug / target interaction are analyzed. It is found that the method is better than the contrast method in the process of similarity test and model prediction, especially in the process of dimensionality reduction.
【学位授予单位】:青岛大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O212.1

【相似文献】

相关期刊论文 前10条

1 李平,王椿镛,许厚泽,熊熊;地球物理反演中奇异值分解应用的若干问题探讨[J];自然科学进展;2001年08期

2 夏江海;;奇异值分解在位场资料处理中的应用[J];物探化探计算技术;1989年02期

3 王懋基,宋正范;奇异值分解在二维半多边形体ΔT异常最优化反演中的应用[J];物探与化探;1991年01期

4 张友民,李庆国,戴冠中,,张洪才;基于奇异值分解的递推辨识方法[J];控制理论与应用;1995年02期

5 罗铁坚;程福兴;周佳;;融合奇异值分解和动态转移链的学术资源推荐模型(英文)[J];中国科学院大学学报;2014年02期

6 聂守平,魏晓燕;数字图像的奇异值分解[J];南京师大学报(自然科学版);2001年01期

7 王潇,柏森,赵波;基于奇异值分解与融合的音频盲认证算法[J];中山大学学报(自然科学版);2004年S2期

8 张焕萍;尹佟明;郑建冬;;基于奇异值分解的致病基因挖掘算法[J];南京航空航天大学学报;2013年02期

9 常丽萍;沈卫星;林尊琪;;基于奇异值分解的数字波前拟合算法[J];光学学报;2006年11期

10 彭培英;申永军;李黎阳;;基于奇异值分解技术的离心机故障诊断[J];动力学与控制学报;2008年02期

相关会议论文 前10条

1 张友民;陈洪亮;戴冠中;;基于奇异值分解的固定区间平滑新方法[A];1995年中国控制会议论文集(上)[C];1995年

2 何田;王立清;刘献栋;朱永波;;基于奇异值分解的信号处理机理及其应用[A];2008年航空试验测试技术峰会论文集[C];2008年

3 张霄;林鸿飞;杨志豪;;基于奇异值分解的蛋白质关系抽取[A];第五届全国信息检索学术会议论文集[C];2009年

4 曹云丽;郭勤涛;徐尧;周瑾;;基于奇异值分解响应面方法的磁轴承转子参数识别[A];第11届全国转子动力学学术讨论会(ROTDYN2014)论文集(上册)[C];2014年

5 吴晓颖;吴俊;董滨江;;TK方法在γ谱分析中的应用[A];第7届全国核电子学与核探测技术学术年会论文集(三)[C];1994年

6 林原;林鸿飞;苏绥;;一种应用奇异值分解的RankBoost排序学习方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

7 金宋友;赵志文;;一种基于奇异值分解盲水印算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年

8 赵卫国;翟自勇;王子君;;基于奇异值分解和神经网络的数字图像水印算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

9 岳红;蒋慰孙;;基于奇异值分解的改进Bayes集员辨识递推算法[A];1995中国控制与决策学术年会论文集[C];1995年

10 王丽娟;谷根代;;对称矩阵非齐次特征值的敏感性分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年

相关博士学位论文 前5条

1 刘正才;测绘工作中甚大规模对称矩阵管理的理论和方法研究[D];中南大学;2008年

2 牟谷芳;矩阵完备化和图的最小秩问题[D];电子科技大学;2015年

3 卢越;矩阵优化问题的数值算法[D];大连理工大学;2015年

4 刘鑫吉;基于纠错码的确定性测量矩阵分析与构造[D];清华大学;2016年

5 周富照;几类约束矩阵方程及其最佳逼近[D];湖南大学;2003年

相关硕士学位论文 前10条

1 廖希洋;高维复杂数据网络与节点属性的统计推断[D];青岛大学;2017年

2 相桂芳;MFA与SVD模糊融合的人脸识别研究[D];合肥工业大学;2015年

3 聂振国;基于奇异值分解的信号处理关键技术研究[D];华南理工大学;2016年

4 夏玉丹;基于S变换和奇异值分解的自动癫痫检测算法[D];山东大学;2016年

5 武慧娟;基于HHT特征提取的雷声信号模式识别[D];陕西师范大学;2016年

6 邹申申;基于手指心电信号时频域分析的身份识别算法研究[D];杭州电子科技大学;2016年

7 曾莼;奇异值分解熵对股票指数的预测力研究[D];南京财经大学;2016年

8 马亚峰;基于FPGA的矩阵奇异值分解加速方案的设计与实现[D];北京交通大学;2017年

9 马斌斌;基于多重奇异值分解熵的属性约简方法研究及应用[D];安徽大学;2017年

10 邢琮琮;重磁数据处理在青海恰卜恰地区的应用研究[D];吉林大学;2017年



本文编号:1573677

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1573677.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3e08c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com