RDPA:一种基于表型文本数据的疾
发布时间:2021-07-23 09:05
随着人工智能技术的发展,利用人工智能(Artificial Intelligence,AI)技术在医疗相关行业进行研究成为了时下最热门的话题。但是在罕见疾病研究领域,由于受限于罕见疾病数据的相对稀少和发病机制复杂的特性,目前人们还没有找到一个高效可靠的算法来对罕见疾病进行预测和辅助诊断。本文针对这一问题,提出了RDPA预测算法(Rare Disease-Phenotype Association Prediction Algorithm)作为问题的解决方案。该算法分为两部分,首先是以经典的TF-IDF算法为基础,针对罕见疾病数据将算法进行了相应的改进,从而实现预测表型和疾病之间一对一关系的关联度的功能。之后本文在前一步的基础上利用融合算法将表型和疾病之间一对一的关系进行融合,进而得到表型和疾病之间的多对一关系,从而使得RDPA算法实现了对多表型疾病进行辅助诊断的功能。通过将RDPA算法与其他常用的预测算法(TF-CRF和TF-IDF-CHI等)进行比较,本文发现,RDPA算法相较于其他的预测算法有着更好的性能,具有更高的精确度和稳定性。此外本文还对RDPA算法在训练集上的表现进行分析,...
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
Mycin系统与Internist-I系统优劣性对比
2018 年华东师范大学硕士学位毕业论文 因。其艺术性的部分,正是目前医疗人工智能所欠缺的地方。2012 年,Friedman教授发表一篇著名的文章“What informatics is and isn't”[18]。文章表明:无论是从技术角度上还是伦理角度,计算机永远是辅助医生进行诊断的工具之一,而无法代替医生的位置。
2018 年华东师范大学硕士学位毕业论文 前现有的评估疾病和表型之间的关联系数的方法主要有皮尔森相关系似度和 TF-IDF 算法这几种公式。皮尔森相关系数尔森相关系数(Pearson correlation coefficient)也被称作是皮尔森积矩(Pearsonproduct-momentcorrelationcoefficient) ,是一种线性相关系数的相关系数是两个样本的协方差和它们的标准偏差的商值的乘积。定义括一个“乘积矩”,即平均调整后的随机变量乘积的平均值(原点的第,或被称为名称中的修饰乘积矩。
【参考文献】:
期刊论文
[1]人工智能医疗不应只是机器人和智能影像管理[J]. 刘婷婷. 现代养生. 2017(18)
[2]一种新的四格表独立性检验[J]. 陈安全,夏帆,钟韵. 统计与决策. 2017(13)
[3]人工智能及在医疗领域的应用[J]. 孔祥溢,王任直. 医学信息学杂志. 2016(11)
[4]大数据的整合分析方法[J]. 马双鸽,王小燕,方匡南. 统计研究. 2015(11)
[5]整合分析(Meta-analysis)方法及其在全球变化中的应用研究[J]. 雷相东,彭长辉,田大伦,孙剑峰. 科学通报. 2006(22)
[6]微机应用关幼波肝病诊疗程序196例分析[J]. 宗相卿,代林田. 辽宁中医杂志. 1992(06)
[7]线性回归系统回归系数的一种新估计[J]. 王松桂. 中国科学(A辑 数学 物理学 天文学 技术科学). 1988(10)
硕士论文
[1]KNN文本分类中特征词权重算法的研究[D]. 赵小华.太原理工大学 2010
本文编号:3299001
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
Mycin系统与Internist-I系统优劣性对比
2018 年华东师范大学硕士学位毕业论文 因。其艺术性的部分,正是目前医疗人工智能所欠缺的地方。2012 年,Friedman教授发表一篇著名的文章“What informatics is and isn't”[18]。文章表明:无论是从技术角度上还是伦理角度,计算机永远是辅助医生进行诊断的工具之一,而无法代替医生的位置。
2018 年华东师范大学硕士学位毕业论文 前现有的评估疾病和表型之间的关联系数的方法主要有皮尔森相关系似度和 TF-IDF 算法这几种公式。皮尔森相关系数尔森相关系数(Pearson correlation coefficient)也被称作是皮尔森积矩(Pearsonproduct-momentcorrelationcoefficient) ,是一种线性相关系数的相关系数是两个样本的协方差和它们的标准偏差的商值的乘积。定义括一个“乘积矩”,即平均调整后的随机变量乘积的平均值(原点的第,或被称为名称中的修饰乘积矩。
【参考文献】:
期刊论文
[1]人工智能医疗不应只是机器人和智能影像管理[J]. 刘婷婷. 现代养生. 2017(18)
[2]一种新的四格表独立性检验[J]. 陈安全,夏帆,钟韵. 统计与决策. 2017(13)
[3]人工智能及在医疗领域的应用[J]. 孔祥溢,王任直. 医学信息学杂志. 2016(11)
[4]大数据的整合分析方法[J]. 马双鸽,王小燕,方匡南. 统计研究. 2015(11)
[5]整合分析(Meta-analysis)方法及其在全球变化中的应用研究[J]. 雷相东,彭长辉,田大伦,孙剑峰. 科学通报. 2006(22)
[6]微机应用关幼波肝病诊疗程序196例分析[J]. 宗相卿,代林田. 辽宁中医杂志. 1992(06)
[7]线性回归系统回归系数的一种新估计[J]. 王松桂. 中国科学(A辑 数学 物理学 天文学 技术科学). 1988(10)
硕士论文
[1]KNN文本分类中特征词权重算法的研究[D]. 赵小华.太原理工大学 2010
本文编号:3299001
本文链接:https://www.wllwen.com/yixuelunwen/swyx/3299001.html