基于改进FP-Growth算法的基因-疾病关系自动提取的应用研究
【部分图文】:
FP-Growth算法构造FP-tree来存储项的频次, 每个项以路径的方式存储在FP-tree中. FP-tree在构建的过程中删除小于最小支持度(最小项出现频次)的项, 留下出现频次较高的项. 与其它树形结构不同, FP-Growth的项可以在一个FP-tree中出现多次. 一个FP-tree中的项只有在项-频次完全不同的时候, 才会分枝. FP-tree节点表示为一个项及其在序列中出现的频次, 路径表示该序列出现的次数. 越靠近根节点的项, 其频次越高. 一个FP-tree通过链接来连接相似的项, 类似于一个链表. 一个FP-tree示例图如图2所示.图2 一个FP-tree示例图
一个FP-tree示例图
第二步, 将病历数据集平均分为n块, 减少载入内存的负担, 做并发处理之用;第三步, 并发处理的模块i中, 包含完整的基因数据集与 1 n 疾病文本数据集, 在模块i的处理过程中, 完成FP-Growth算法的基本数据扫描操作;
【相似文献】
相关期刊论文 前10条
1 陈强,冯焕清,彭虎;一种改进的心脏电兴奋矢量传播算法[J];北京生物医学工程;2002年01期
2 于志伟,陶波;用改进的ISRA算法求解ECT问题[J];生物医学工程学杂志;1997年01期
3 刘勇;;一种基于人工免疫系统的学习算法研究[J];西南农业大学学报(自然科学版);2006年04期
4 邓伟,金丕焕,林果为;BP神经网络修剪算法筛选白血病预后危险因素[J];复旦学报(医学版);2003年02期
5 胡海涛,吴健,胡正国;医疗解析算法研究[J];医学信息;2002年08期
6 唐慧敏;龚学余;杨振;吕知平;张子健;曹瑛;王翰宇;刘归;胡永梅;杨晓喻;;先进外照射光子剂量算法和各向异性分析算法在乳腺癌胸壁放疗中的剂量学差异[J];中国医学物理学杂志;2015年06期
7 李刚;邓力;陈朝斌;叶涛;莫则尧;;BNCT治疗规划系统MCDB算法及测试[J];计算物理;2012年05期
8 彭虎,陈强,詹长安,冯焕清,张作生;基于矢量传播算法的束支传导阻滞QRST波形仿真[J];生物医学工程学杂志;2002年02期
9 姬军,董秀珍,王海滨,漆家学,王丹,张鹏;心电信号QRS波的识别算法及程序设计[J];北京生物医学工程;2001年02期
10 杨杰;罗洪;;热传导算法在致病miRNA预测中的应用分析[J];西南民族大学学报(自然科学版);2019年05期
相关博士学位论文 前2条
1 毕峰;单通道诱发电位信号的快速提取算法研究[D];大连理工大学;2014年
2 肖球;基于生物网络的致病miRNA预测及模块识别算法研究[D];湖南大学;2017年
相关硕士学位论文 前7条
1 舒才良;人工免疫分类和异常识别算法的改进[D];福建师范大学;2011年
2 秘熙超;神经信息流分析中gPDC与PCMI算法的比较及应用[D];南开大学;2014年
3 彭涛;基于人体代谢挥发性化合物判断生命迹象的算法研究[D];燕山大学;2015年
4 付宇光;脑功能成像中的优化算法、模型及其应用研究[D];大连理工大学;2002年
5 张增芹;IMRT逆向计划中优化算法的研究[D];东北大学;2009年
6 邱浩;基于EM算法的医学影像数据的分类研究[D];湖南师范大学;2016年
7 张文博;新型自适应免疫克隆混合算法及其应用研究[D];吉林大学;2007年
本文编号:2887757
本文链接:https://www.wllwen.com/xiyixuelunwen/2887757.html