数据挖掘在蛋白质翻译后修饰及疾病诊断和预后中的应用
本文选题:数据挖掘 + 乙酰化 ; 参考:《华东理工大学》2017年博士论文
【摘要】:在生物医学领域,基于各种组学的转录组、蛋白质组以及临床上患者病理记录等数据层出不穷,如何从海量生物医学数据中挖掘出新颖且有用的信息来揭示生物医学机制已成为人们关注的热点之一。数据挖掘已广泛地运用到生物信息的各个方向中,但仍面临各种挑战和机遇。本课题分别从蛋白质、microRNA和临床医学数据层面对蛋白质翻译后修饰、疾病的诊断和预后进行了数据挖掘分析。在本课题中,我们尽可能多地收集赖氨酸乙酰化的数据,在蛋白质和肽段水平都做了去冗余处理,整合了氨基酸物化属性(AAPP)、位置特异性组成(PSSC)以及相邻氨基酸之间的转换概率(TPM)等生物学特征,并构建预测模型LAceP。与其他已有的方法比较,LAceP模型准确率最高,而且能预测分析多种生物的乙酰化位点,模型的稳定性更高,应用性更广。另外,为了便于生物科学家使用,LAceP做成了公开且免费的网络服务器,用户可以在网上简单快速地输入序列进行预测分析。LAceP模型为蛋白质乙酰化修饰研究提供了新的分析方法,有助于科研人员更好地理解蛋白质的作用机制。高通量测序的方法为某些疾病的诊断提供了新的研究思路。在本课题中,基于microRNA的高通量测序技术,我们提出了一种新颖的基于两层逻辑回归模型的HBV相关疾病诊断方法。通过样本收集、数据处理、模型选择、特征选择和模型优化过程,我们筛选到9个microRNAs可作为HBV相关疾病诊断的潜在标志物。第一层模型利用3个microRNAs区分HBV相关疾病和健康对照组。第二层模型通过8个microRNAs将HBV相关疾病进一步分为肝硬化和慢乙肝。两组独立测试集的验证结果显示,我们的模型具有高的准确率和鲁棒性。通过对筛选到的microRNAs和它们的靶基因进行功能富集分析,这些microRNAs显著性地富集到了 HBV相关疾病和相关的功能通路。除了疾病的诊断,疾病预后也是生物医学领域最为关心的话题之一。而影响预后的因素除了病人的身体素质外,还有治疗方式、病情以及社会生活等因素。在课题中,我们收集了 SEER数据库中近十年50岁以下的Ⅰ期子宫内膜样腺癌(EEAC)患者的临床病理学诊断和治疗记录数据。采用倾向得分匹配以及一些统计学方法对其进行数据挖掘,回顾性地分析了年轻患者保留或切除卵巢对其生存预后的影响。研究结果表明,与切除卵巢的患者相比,保留卵巢的患者显著性地倾向于更小的诊断年龄、更早的癌症分期和分化更好的肿瘤组织,她们的肿瘤更小,接受放疗和淋巴结切除术的可能性更低。经过倾向得分匹配随机化的过程后,保留卵巢和切除卵巢组间排除许多潜在的混杂因素,去除许多数据间的噪音,两组间各临床特征的差异也将不再显著。对降噪之后的数据进行多因素统计分析结果显示,保留卵巢以及切除卵巢对总体生存和肿瘤特异性生存均无显著性差异。保留卵巢对于年轻的Ⅰ期患者可能是安全的,患者可以在确保治疗效果的情况下,考虑接受较为保守的治疗方式从而保障其正常的生活质量。以上结果对临床诊断和治疗具有一定的指导意义。总体而言,本文从蛋白质、microRNA和临床医疗信息等层面对数据进行挖掘分析,提出了 LAceP模型对赖氨酸乙酰化位点预测,准确率较高,稳定性良好,网络服务器版本的预测工具,具有一定的实用性。论文基于两层模型利用9个microRNA标志物对HBV相关肝病进行诊断,模型具有较高的准确率和鲁棒性,能明确区分HBV相关慢性肝炎和肝硬化,具有一定的临床应用价值。另外,论文基于倾向得分匹配算法,提出的Ⅰ期年轻子宫内膜样腺癌患者保留卵巢具有一定安全性的建议,具有良好的临床指导意义。
[Abstract]:This paper presents a novel method for the diagnosis and prognosis of HBV related diseases from the data of protein , microRNA and clinical medicine . This paper analyses the data from the aspects of protein , microRNA , clinical medical information and so on , and puts forward the application value of LAceP model in diagnosis of HBV - related liver diseases .
【学位授予单位】:华东理工大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:R363;Q51
【相似文献】
相关期刊论文 前10条
1 傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期
2 黄宏涛,陈阳;数据挖掘在客户关系管理中的应用[J];中国西部科技;2005年07期
3 董大鸿,何海青;浅谈数据挖掘语言[J];江西科学;2005年03期
4 曾莹,陈晓柱;数据挖掘及算法浅谈[J];中国科技信息;2005年14期
5 谭建中;浅析实施数据挖掘项目需要考虑的问题[J];大众科技;2005年09期
6 石峰,周绍梅;数据挖掘语言及其标准化浅析[J];江西科学;2005年01期
7 周忠眉;数据挖掘课程大纲的建设[J];漳州师范学院学报(自然科学版);2005年01期
8 王秀丽;数据挖掘功能特性及其应用流程分析[J];科技创业月刊;2005年05期
9 刘晓华;;数据挖掘在银行中的应用[J];科技资讯;2006年32期
10 张敏;;数据挖掘在数字化校园建设中的应用分析[J];内江科技;2007年04期
相关会议论文 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
相关重要报纸文章 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
相关博士学位论文 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 何伟全;云南高校学生意外伤害因素关联规则挖掘及风险管控体系研究[D];昆明理工大学;2015年
8 段功豪;基于多结构数据挖掘的滑坡灾害预测模型研究[D];中国地质大学;2016年
9 白晓明;基于数据挖掘的复合材料宏—细观力学模型研究[D];哈尔滨工业大学;2016年
10 蓝永豪(LAM Wing Ho);基于数据挖掘技术分析当代中医名家痤疮验方经验研究[D];南京中医药大学;2016年
相关硕士学位论文 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
,本文编号:1813307
本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/1813307.html