基于关键语义信息的中医肾病病情文本分类问题研究
发布时间:2021-01-31 13:26
随着人工智能的快速发展以及国家政策对中医药的大力扶持,中医药信息化、智能化迎来了新的契机,也为改变目前中医药发展较慢这一困境创造了新机遇。本文以某中医院提供的中医病情文本数据为基础,对中医智能辨证问题开展了研究。针对中医病情文本特点,提出了基于关键词的中医病情文本关键语义信息提取方法,然后在深入了解中医辨证的基础上,将中医肾病辨证问题抽象成一个有监督的多分类问题,使用深度学习对中医肾病病情文本进行分类,最后构建了中医药智能服务平台。论文主要贡献如下:1)深入分析了中医病情文本的特点,使用文本N-Gram片段的信息熵等指标进行领域词识别,进一步提升了分词精度。2)基于中医病情文本特点,提出了一种基于病位的中医病情文本关键词提取算法(TF-IDF-DP),为获得病情文本关键语义信息打下了基础。3)在病情文本关键词的基础上,提出了一种基于关键词的中医病情文本关键语义信息提取方法(DKSIEK),完成病位、症状、症状有无关系、症状严重程度等关键语义信息提取。实验结果表明,该方法不仅能够有效提取关键语义信息,还起到抑制噪音的作用。4)深入调研了深度学习文本分类方法,然后全面系统地将其应用到中医肾...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
图1.12012-2018H1中国人工智能私募股权投资市场整体情况2??人工智能的发展带动了智能医疗的发展
?拉?/匕,??图2.4核函数特征映射??图2.4是核函数将输入空间映射到高维特征空间的示意图,因此,带有核函??数的SVM决策函数可以写为:??f(x)?=?signed?atyiKix?■?x〇?+?6*)?(2.23)??2.3.3随机森林分类模型??随机森林(Random?Forest)是有监督的集成学习模型(ensemble?learning??model),也被誉为“代表集成学习技术水平的方法”。随机森林主要用于分类和回??归问题,其核心思想是通过建立多个决策树,然后将其集成,最后获得更准确、??更稳定的预测结果。??21??
?1??图2.5随机森林分类示意图??图2.5展示了随机森林分类模型,可以看出其2个重要特征:1)多个决策树??组成分类模型;2)分类结果通过多个决策树进行投票产生。因此,随机森林中单??个决策树的构建是随机森林构建的重要步骤,下面给出随机森林单个决策树构建??步骤,分为数据随机选取和特征随机选取2大步骤:??1)
【参考文献】:
期刊论文
[1]自动关键词抽取研究综述[J]. 赵京胜,朱巧明,周国栋,张丽. 软件学报. 2017(09)
[2]基于改进TextRank的关键词抽取算法[J]. 张莉婧,李业丽,曾庆涛,雷嘉丽,杨鹏. 北京印刷学院学报. 2016(04)
[3]基于LDA和SVM的中文文本分类研究[J]. 宋钰婷,徐德华. 现代计算机(专业版). 2016(05)
[4]基于中医核心思维的机器学习医用诊疗系统设计[J]. 秦延斌. 中华中医药学刊. 2015(09)
[5]基于贝叶斯分类算法的治疗中风中药组方研究[J]. 邢雁辉,崔蒙,储戟农,胡雪琴,杨硕,温先荣,亢力,雷蕾. 中西医结合心脑血管病杂志. 2015(04)
[6]基于支持向量机的中药药理作用预测研究[J]. 雷蕾,杨策,张黎,邢燕辉,温先荣. 世界科学技术-中医药现代化. 2013(08)
[7]一种基于粗集简约的中医专家系统设计和实现[J]. 王瑞祥,刘晓玉. 时珍国医国药. 2013(10)
[8]我国中医药信息化建设与发展[J]. 孟凡红,万芳. 中国中医药信息杂志. 2010(11)
[9]从中医古籍数据库建设看中医古籍数字化[J]. 李兵,刘国正,符永驰,裘俭,张伟娜. 中国中医药信息杂志. 2009(03)
[10]基于案例推理的中医诊疗专家系统[J]. 杨健,马小兰,杨邓奇. 时珍国医国药. 2008(07)
博士论文
[1]基于机器学习技术的《伤寒论》方证分析方法研究[D]. 孙燕.北京中医药大学 2007
[2]中医方剂数据挖掘模式和算法研究[D]. 周忠眉.浙江大学 2006
硕士论文
[1]基于文本语义分块的中医病情分类问题研究[D]. 付钊.浙江大学 2018
[2]中医药症状的中文分词与句子相似度研究[D]. 毛宇.浙江大学 2017
本文编号:3010956
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
图1.12012-2018H1中国人工智能私募股权投资市场整体情况2??人工智能的发展带动了智能医疗的发展
?拉?/匕,??图2.4核函数特征映射??图2.4是核函数将输入空间映射到高维特征空间的示意图,因此,带有核函??数的SVM决策函数可以写为:??f(x)?=?signed?atyiKix?■?x〇?+?6*)?(2.23)??2.3.3随机森林分类模型??随机森林(Random?Forest)是有监督的集成学习模型(ensemble?learning??model),也被誉为“代表集成学习技术水平的方法”。随机森林主要用于分类和回??归问题,其核心思想是通过建立多个决策树,然后将其集成,最后获得更准确、??更稳定的预测结果。??21??
?1??图2.5随机森林分类示意图??图2.5展示了随机森林分类模型,可以看出其2个重要特征:1)多个决策树??组成分类模型;2)分类结果通过多个决策树进行投票产生。因此,随机森林中单??个决策树的构建是随机森林构建的重要步骤,下面给出随机森林单个决策树构建??步骤,分为数据随机选取和特征随机选取2大步骤:??1)
【参考文献】:
期刊论文
[1]自动关键词抽取研究综述[J]. 赵京胜,朱巧明,周国栋,张丽. 软件学报. 2017(09)
[2]基于改进TextRank的关键词抽取算法[J]. 张莉婧,李业丽,曾庆涛,雷嘉丽,杨鹏. 北京印刷学院学报. 2016(04)
[3]基于LDA和SVM的中文文本分类研究[J]. 宋钰婷,徐德华. 现代计算机(专业版). 2016(05)
[4]基于中医核心思维的机器学习医用诊疗系统设计[J]. 秦延斌. 中华中医药学刊. 2015(09)
[5]基于贝叶斯分类算法的治疗中风中药组方研究[J]. 邢雁辉,崔蒙,储戟农,胡雪琴,杨硕,温先荣,亢力,雷蕾. 中西医结合心脑血管病杂志. 2015(04)
[6]基于支持向量机的中药药理作用预测研究[J]. 雷蕾,杨策,张黎,邢燕辉,温先荣. 世界科学技术-中医药现代化. 2013(08)
[7]一种基于粗集简约的中医专家系统设计和实现[J]. 王瑞祥,刘晓玉. 时珍国医国药. 2013(10)
[8]我国中医药信息化建设与发展[J]. 孟凡红,万芳. 中国中医药信息杂志. 2010(11)
[9]从中医古籍数据库建设看中医古籍数字化[J]. 李兵,刘国正,符永驰,裘俭,张伟娜. 中国中医药信息杂志. 2009(03)
[10]基于案例推理的中医诊疗专家系统[J]. 杨健,马小兰,杨邓奇. 时珍国医国药. 2008(07)
博士论文
[1]基于机器学习技术的《伤寒论》方证分析方法研究[D]. 孙燕.北京中医药大学 2007
[2]中医方剂数据挖掘模式和算法研究[D]. 周忠眉.浙江大学 2006
硕士论文
[1]基于文本语义分块的中医病情分类问题研究[D]. 付钊.浙江大学 2018
[2]中医药症状的中文分词与句子相似度研究[D]. 毛宇.浙江大学 2017
本文编号:3010956
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3010956.html
最近更新
教材专著