基于云平台的中医临床大数据频繁模式并行挖掘方法研究
发布时间:2020-12-13 23:27
我国中医药资源丰富,历史悠久,中医药领域学术观点及思想的传播主要通过个人经验和实践,以及师徒之间的口口相传。由于信息处理和传播速度的缓慢,导致了中医药在当代社会发展和传承困难,已经难以满足当代社会对中医药知识的需求。中医药振兴发展的重要引擎和技术支撑是实现中医药信息化,中医药信息化建设也被纳入国家的“十三五”规划中。在云计算、数据挖掘等信息技术的加持下,中医药信息化已经成为研究热点。中医讲究辨证施治,临床医学是中医学的基础学科,辨证论治过程中产生了症状、证候、病机、治则治法、诊断、四诊信息、中药处方等“知识密集型”数据,此类知识量丰富、非结构化的数据成为中医临床数据研究的重要资料。本研究致力于研究中医药“知识密集型”数据,挖掘“症—证—方”之间潜在的、有用的信息。在现有的数据分析挖掘方法的基础上,本文主要在云计算环境下并行挖掘框架的搭建、云计算环境下频繁模式挖掘算法等方面进行了研究。本文的主要创新性工作如下:1)中医临床数据来源多样、数据结构复杂,加上肺癌患者的症情差别较大,往往表现出多病位多病性错综复杂的证候,治疗上也多以复方为主,大大增加了分析的难度,采用传统的数据分析方法面临挑战...
【文章来源】:南京中医药大学江苏省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
图2-2?MapReduce并行计算过程??MapReduce运行按照时间顺序包括五个阶段:输入分片(input?split)、map阶段、combiner??阶段、shuffle阶段和reduce阶段
Dffi(3)??DAE?(3),DAEB(3),DAB(3)??图3-3?FP-Tree的挖掘过程??最后,设置最小置信度。为便于分析说明,本小节实验中设置的最小置信度为0.85,??执行DeepFP-Growth算法,得出方药示例数据库的核心方为:BEA。??3.4实验结果比较??下面我们对云计算环境下运行并行Deep?FP-Growth算法,并在不同节点、不同数据量??下进行核心方挖掘运行时间的比较,对比试验结果如图3-4所示。测试数据集部分为真实??世界数据,剩下的部分为合成数据。三个数据集的记录条数分别为90万、120万和150万。??为了方便中医药治疗肺癌的核心方挖掘,Deep?FP-Growth算法较之FP-Growth算法,??增加了有效后继的判断与计算。由图3-4可知,云计算环境下,节点数越多、数据量越小,??核心方挖掘时间越少。??19??
4.3.2?药物出现的频次与频率??根据统计,病例中共出现500种药物,按照药物出现频率的高低排序,选取频率不低??于40%的药物,共计19种。总体用药频次与频率见表4-2,药物出现频次见图4-3。???表4-2总体用药频次与频率???药名??mm???北沙参?2481?93.0259%??南沙参?2362?88.5639%??麦冬?2361?88.5264%??山慈菇?2308?86.5392%??泽漆?2298?86.1642%??太子参?1887?70.7537%???23??
【参考文献】:
期刊论文
[1]现代名老中医临床诊疗方药数据抽取与清理方法研究[J]. 谢佳东,房裴裴,胡孔法,杨涛,胡晨骏,李柳. 时珍国医国药. 2017(11)
[2]基于FP-Tree的中药饮片频繁路径模式挖掘算法[J]. 房裴裴,胡孔法,胡晨骏,谢佳东. 时珍国医国药. 2017(06)
[3]工业和信息化部印发《云计算发展三年行动计划(2017-2019年)》[J]. 印刷杂志. 2017(05)
[4]一种面向HDFS的多层索引技术[J]. 何龙,陈晋川,杜小勇. 软件学报. 2017(03)
[5]云计算中Hadoop技术研究与应用综述[J]. 夏靖波,韦泽鲲,付凯,陈珍. 计算机科学. 2016(11)
[6]中医药发展“十三五”规划发布[J]. 魏敏. 中医药管理杂志. 2016(17)
[7]论中医药数据挖掘[J]. 朱彦,朱玲,崔蒙. 中华中医药杂志. 2016(08)
[8]中医药治疗中晚期非小细胞肺癌文献计量分析[J]. 陆颖,李洁,陈驰,许玲. 中国中医药信息杂志. 2015(09)
[9]十三五:大力发展中医药信息化建设 打造智慧云服务平台[J]. 医学信息学杂志. 2015(08)
[10]中医药“知识密集型”数据研究思路[J]. 于彤,李敬华,杨硕,于琦. 中国中医药图书情报杂志. 2015(04)
博士论文
[1]集群环境下的关联规则挖掘及应用[D]. 荀亚玲.太原科技大学 2017
硕士论文
[1]基于Hadoop的MapReduce的性能分析与优化[D]. 戴新华.南京邮电大学 2015
[2]海量数据并行挖掘技术研究[D]. 孙芬芬.北京交通大学 2014
[3]基于FP-Growth关联规则的并行算法分析及其应用研究[D]. 李涛.辽宁工程技术大学 2011
[4]关联规则算法研究及其在中医药数据挖掘中的应用[D]. 马丽伟.南京理工大学 2009
本文编号:2915369
【文章来源】:南京中医药大学江苏省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
图2-2?MapReduce并行计算过程??MapReduce运行按照时间顺序包括五个阶段:输入分片(input?split)、map阶段、combiner??阶段、shuffle阶段和reduce阶段
Dffi(3)??DAE?(3),DAEB(3),DAB(3)??图3-3?FP-Tree的挖掘过程??最后,设置最小置信度。为便于分析说明,本小节实验中设置的最小置信度为0.85,??执行DeepFP-Growth算法,得出方药示例数据库的核心方为:BEA。??3.4实验结果比较??下面我们对云计算环境下运行并行Deep?FP-Growth算法,并在不同节点、不同数据量??下进行核心方挖掘运行时间的比较,对比试验结果如图3-4所示。测试数据集部分为真实??世界数据,剩下的部分为合成数据。三个数据集的记录条数分别为90万、120万和150万。??为了方便中医药治疗肺癌的核心方挖掘,Deep?FP-Growth算法较之FP-Growth算法,??增加了有效后继的判断与计算。由图3-4可知,云计算环境下,节点数越多、数据量越小,??核心方挖掘时间越少。??19??
4.3.2?药物出现的频次与频率??根据统计,病例中共出现500种药物,按照药物出现频率的高低排序,选取频率不低??于40%的药物,共计19种。总体用药频次与频率见表4-2,药物出现频次见图4-3。???表4-2总体用药频次与频率???药名??mm???北沙参?2481?93.0259%??南沙参?2362?88.5639%??麦冬?2361?88.5264%??山慈菇?2308?86.5392%??泽漆?2298?86.1642%??太子参?1887?70.7537%???23??
【参考文献】:
期刊论文
[1]现代名老中医临床诊疗方药数据抽取与清理方法研究[J]. 谢佳东,房裴裴,胡孔法,杨涛,胡晨骏,李柳. 时珍国医国药. 2017(11)
[2]基于FP-Tree的中药饮片频繁路径模式挖掘算法[J]. 房裴裴,胡孔法,胡晨骏,谢佳东. 时珍国医国药. 2017(06)
[3]工业和信息化部印发《云计算发展三年行动计划(2017-2019年)》[J]. 印刷杂志. 2017(05)
[4]一种面向HDFS的多层索引技术[J]. 何龙,陈晋川,杜小勇. 软件学报. 2017(03)
[5]云计算中Hadoop技术研究与应用综述[J]. 夏靖波,韦泽鲲,付凯,陈珍. 计算机科学. 2016(11)
[6]中医药发展“十三五”规划发布[J]. 魏敏. 中医药管理杂志. 2016(17)
[7]论中医药数据挖掘[J]. 朱彦,朱玲,崔蒙. 中华中医药杂志. 2016(08)
[8]中医药治疗中晚期非小细胞肺癌文献计量分析[J]. 陆颖,李洁,陈驰,许玲. 中国中医药信息杂志. 2015(09)
[9]十三五:大力发展中医药信息化建设 打造智慧云服务平台[J]. 医学信息学杂志. 2015(08)
[10]中医药“知识密集型”数据研究思路[J]. 于彤,李敬华,杨硕,于琦. 中国中医药图书情报杂志. 2015(04)
博士论文
[1]集群环境下的关联规则挖掘及应用[D]. 荀亚玲.太原科技大学 2017
硕士论文
[1]基于Hadoop的MapReduce的性能分析与优化[D]. 戴新华.南京邮电大学 2015
[2]海量数据并行挖掘技术研究[D]. 孙芬芬.北京交通大学 2014
[3]基于FP-Growth关联规则的并行算法分析及其应用研究[D]. 李涛.辽宁工程技术大学 2011
[4]关联规则算法研究及其在中医药数据挖掘中的应用[D]. 马丽伟.南京理工大学 2009
本文编号:2915369
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2915369.html