宫颈癌人类乳头瘤病毒分型预测方法研究
本文关键词:宫颈癌人类乳头瘤病毒分型预测方法研究
更多相关文章: 人类乳头瘤病毒 “序列空间”模型 马尔可夫 位置特异性模型 支持向量机
【摘要】:宫颈癌是导致女性癌症发病率和死亡率的主要原因之一,每年大约有50万的宫颈癌新增病例,其中28万死亡,它已经成为第二大女性常见癌症,并且发病人群趋于年轻化。大量的基础与临床研究发现HPV感染是诱发宫颈癌的首要启动因素。到目前为止,已鉴定出200余种HPV类型,根据毒性或对人体致病力的强弱,可分为低危险型HPV和高危险型HPV。在宫颈低度病变的妇女中,高危型HPV感染阳性的妇女宫颈病变进展的危险性远远大于低危型HPV感染者。因此,HPV分型对宫颈癌的判断预后及指导治疗具有重要价值,成为国内外研究者关注的问题。本文主要研究HPV分型预测方法,研究内容概括如下: 1.综述了宫颈癌分型模型中信息提取方法和分类算法。重点介绍了几种常用的蛋白质序列信息提取方法和经典的分类算法,系统分析各种信息提取方法与分类算法的优缺点及适用范围,为本文研究方法的选择提供了理论基础和依据。 2.提出一种基于“蛋白质序列空间”的宫颈癌HPV高危型预测方法。基于氨基酸突变矩阵,利用集合论方法,定义并构建了蛋白质的“蛋白质序列空间”。通过构建基于“蛋白质序列空间”的字统计模型,提取了HPV蛋白质序列的同源信息,结合支持向量机预测算法,实现对HPV高危型的分型预测。本文以准确率和F1-分数为评价指标,系统地比较了不同突变矩阵和字长度对预测模型的影响。结果表明,基于E6数据集和p40突变矩阵的预测模型表现最好,其准确率和F1分值分别为95.59%和90.91%。此外,本文还对四个未知类型的HPV进行预测,并与现有的方法进行比较,结果也证明了该方法的有效性。 3.提出了一种基于位置特异性的HPV高危型预测方法。基于核苷酸序列,我们首先设计了特定碱基的位置矩阵,利用香农熵度量了特定碱基局部范围内核苷酸分布的随机度。结果表明,核苷酸C的右侧和核苷酸G的左侧的第一个位置的四种核苷酸的分布差异较显著,高危型与低危型HPV序列中保守区域分布较相似。根据马尔可夫模型的性质,我们构建了位置特异性统计模型,进而描述特定碱基局部范围中核苷酸的动态分布,并应用于构建HPV分型预测模型。本文选择Alpha、Beta、Gamma三类HPV数据进行实验,结果表明该方法可以较好地区别不同类别,其整体分类准确率可达97.18%,,各类预测的准确率分别为98.41%、100%和91.89%。
【关键词】:人类乳头瘤病毒 “序列空间”模型 马尔可夫 位置特异性模型 支持向量机
【学位授予单位】:浙江理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R737.33
【目录】:
- 摘要4-5
- ABSTRACT5-7
- 目录7-9
- 1 绪论9-19
- 1.1 研究背景及意义9-10
- 1.1.1 研究背景9-10
- 1.1.2 研究意义10
- 1.2 人乳头瘤病毒基础知识10-13
- 1.2.1 人乳头瘤病毒的结构和功能10-12
- 1.2.2 HPV 的致病机理12-13
- 1.2.3 HPV 的分型13
- 1.3 HPV 检测方法的研究进展13-15
- 1.3.1 直接杂交分析13-14
- 1.3.2 基于 PCR 的检测方法14-15
- 1.4 论文的主要工作和安排15-19
- 1.4.1 本文研究的主要内容15-17
- 1.4.2 本文技术路线17-18
- 1.4.3 本文组织结构18-19
- 2 序列信息提取方法与分类预测算法19-28
- 2.1 引言19
- 2.2 蛋白质信息提取方法19-24
- 2.2.1 序列成分信息提取方法20-21
- 2.2.2 氨基酸物理化学信息提取方法21-23
- 2.2.3 蛋白质结构信息提取方法23-24
- 2.3 预测分类算法24-26
- 2.3.1 支持向量机24-26
- 2.3.2 神经网络方法26
- 2.3.3 K-近邻法26
- 2.4 本章小结26-28
- 3 基于“蛋白质序列空间”的宫颈癌 HPV 高危型预测28-42
- 3.1 引言28
- 3.2 材料与方法28-34
- 3.2.1 实验数据集构建28-29
- 3.2.2 “蛋白质序列空间”构建29-32
- 3.2.3 “蛋白质序列空间”信息提取32-33
- 3.2.4 预测算法33-34
- 3.3 结果与讨论34-41
- 3.3.1 评估方法和指标34-36
- 3.3.2 不同预测方法的比较36-38
- 3.3.3 参数讨论38-40
- 3.3.4 未知 HPV 类型的预测分析40-41
- 3.4 本章小结41-42
- 4 基于位置特异性的宫颈癌 HPV 分类预测42-53
- 4.1 引言42
- 4.2 材料与方法42-46
- 4.2.1 马尔可夫算法42-43
- 4.2.2 位置特异性统计模型43-45
- 4.2.3 预测算法45-46
- 4.3 结果与讨论46-52
- 4.3.1 特定核苷酸的局部分布评估46-47
- 4.3.2 宫颈癌 HPV 高危型和低危型序列分析47-49
- 4.3.3 HPV 分类预测结果49-52
- 4.4 本章小结52-53
- 5 总结与展望53-55
- 参考文献55-59
- 作者在读期间发表的学术论文及参加的科研项目59-60
- 致谢60
【共引文献】
中国期刊全文数据库 前10条
1 马丽华;古扎丽努尔·阿不力孜;;男性与宫颈癌发病高危因素研究[J];重庆医学;2011年28期
2 孟瑞琳;马文军;许燕君;宋秀玲;聂少萍;徐浩锋;许晓君;蔡秋茂;夏亮;;广东省妇女乳腺癌和宫颈癌筛查率及相关影响因素分析[J];华南预防医学;2010年02期
3 饶小卫;谢满;曾爱群;黄小梅;温盛英;陈小兰;李金伟;吴修洪;;宫颈癌患者心理状况及影响因素分析[J];赣南医学院学报;2008年06期
4 李文静;胡红波;许红雁;李泉;;三级预防在经济欠发达地区宫颈癌防治中的价值[J];国际检验医学杂志;2011年01期
5 余永美;;宫颈癌患者行同步放化疗后持续阴道冲洗的效果[J];安徽医药;2012年08期
6 艾力江·吐尔逊;胡尔西旦·那斯尔;忙尼沙·阿布都拉;杨建梅;包永星;;青年早期宫颈癌患者预后因素的临床分析[J];当代医学;2012年24期
7 王有良;朱一剑;丁显平;;L1、E6和E7基因序列分析[J];成都医学院学报;2013年03期
8 江金群;张玉心;徐成岭;胡建国;马杰;石莹;;Hes1基因启动子的克隆及活性研究[J];蚌埠医学院学报;2013年09期
9 Jin-Feng Wang;Chao Liu;Qu Zhang;Guan-Hong Huang;;Research progress in the radioprotective effect of the canonical Wnt pathway[J];Cancer Biology & Medicine;2013年02期
10 葛亮;吴先志;邓超雄;;T管造瘘在晚期宫颈癌患者输尿管支架置入中的应用[J];蚌埠医学院学报;2013年12期
本文编号:1031631
本文链接:https://www.wllwen.com/yixuelunwen/fuchankeerkelunwen/1031631.html