当前位置:主页 > 医学论文 > 西医药论文 >

基于改进FP-Growth算法的基因-疾病关系自动提取的应用研究

发布时间:2020-11-17 17:52
   传统的医学文献检索算法FP-Growth算法存在效率低下、内存溢出等问题,据此提出了一个改进的FP-Growth算法.首先将数据集平均分块,以并行的方式构建FP-Tree树,以减少内存负担,再以粒子群算法优化FP-Growth的FP-Tree树迭代过程,并优化并发过程.经验证,改进后的算法能提高内存的使用率与算法的运行效率.
【部分图文】:

流程图,流程图,算法,示例


FP-Growth算法构造FP-tree来存储项的频次, 每个项以路径的方式存储在FP-tree中. FP-tree在构建的过程中删除小于最小支持度(最小项出现频次)的项, 留下出现频次较高的项. 与其它树形结构不同, FP-Growth的项可以在一个FP-tree中出现多次. 一个FP-tree中的项只有在项-频次完全不同的时候, 才会分枝. FP-tree节点表示为一个项及其在序列中出现的频次, 路径表示该序列出现的次数. 越靠近根节点的项, 其频次越高. 一个FP-tree通过链接来连接相似的项, 类似于一个链表. 一个FP-tree示例图如图2所示.图2 一个FP-tree示例图

示例,算法,流程图


一个FP-tree示例图

过程图,疾病,过程图,基因


第二步, 将病历数据集平均分为n块, 减少载入内存的负担, 做并发处理之用;第三步, 并发处理的模块i中, 包含完整的基因数据集与 1 n 疾病文本数据集, 在模块i的处理过程中, 完成FP-Growth算法的基本数据扫描操作;
【相似文献】

相关期刊论文 前10条

1 陈强,冯焕清,彭虎;一种改进的心脏电兴奋矢量传播算法[J];北京生物医学工程;2002年01期

2 于志伟,陶波;用改进的ISRA算法求解ECT问题[J];生物医学工程学杂志;1997年01期

3 刘勇;;一种基于人工免疫系统的学习算法研究[J];西南农业大学学报(自然科学版);2006年04期

4 邓伟,金丕焕,林果为;BP神经网络修剪算法筛选白血病预后危险因素[J];复旦学报(医学版);2003年02期

5 胡海涛,吴健,胡正国;医疗解析算法研究[J];医学信息;2002年08期

6 唐慧敏;龚学余;杨振;吕知平;张子健;曹瑛;王翰宇;刘归;胡永梅;杨晓喻;;先进外照射光子剂量算法和各向异性分析算法在乳腺癌胸壁放疗中的剂量学差异[J];中国医学物理学杂志;2015年06期

7 李刚;邓力;陈朝斌;叶涛;莫则尧;;BNCT治疗规划系统MCDB算法及测试[J];计算物理;2012年05期

8 彭虎,陈强,詹长安,冯焕清,张作生;基于矢量传播算法的束支传导阻滞QRST波形仿真[J];生物医学工程学杂志;2002年02期

9 姬军,董秀珍,王海滨,漆家学,王丹,张鹏;心电信号QRS波的识别算法及程序设计[J];北京生物医学工程;2001年02期

10 杨杰;罗洪;;热传导算法在致病miRNA预测中的应用分析[J];西南民族大学学报(自然科学版);2019年05期


相关博士学位论文 前2条

1 毕峰;单通道诱发电位信号的快速提取算法研究[D];大连理工大学;2014年

2 肖球;基于生物网络的致病miRNA预测及模块识别算法研究[D];湖南大学;2017年


相关硕士学位论文 前7条

1 舒才良;人工免疫分类和异常识别算法的改进[D];福建师范大学;2011年

2 秘熙超;神经信息流分析中gPDC与PCMI算法的比较及应用[D];南开大学;2014年

3 彭涛;基于人体代谢挥发性化合物判断生命迹象的算法研究[D];燕山大学;2015年

4 付宇光;脑功能成像中的优化算法、模型及其应用研究[D];大连理工大学;2002年

5 张增芹;IMRT逆向计划中优化算法的研究[D];东北大学;2009年

6 邱浩;基于EM算法的医学影像数据的分类研究[D];湖南师范大学;2016年

7 张文博;新型自适应免疫克隆混合算法及其应用研究[D];吉林大学;2007年



本文编号:2887757

资料下载
论文发表

本文链接:https://www.wllwen.com/xiyixuelunwen/2887757.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18b99***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com