当前位置:主页 > 社科论文 > 图书档案论文 >

基于混合深度学习模型的临床医学文本分类研究

发布时间:2024-05-30 23:54
  随着我国“双一流”建设战略的持续推进,大型公立医院日益重视自身学科建设。尤其当今医院的地域优势逐渐削减,竞争压力越来越大,加强学科建设成为提升医院竞争力、促进医院发展的内在需求。而学科评估是学科建设过程中的重要一环,它不仅是评估学科建设成果、发现学科建设问题、指导学科建设方向的重要方法,也是提高医院核心竞争力的重要手段。在学科评估中,将SCI论文等文本数据按照学科评估体系进行数据分类是开展学科评估工作的基础,学科分类的准确性和效率对学科评估工作的顺利推进影响甚大。目前公开发表的针对学科评估中文本分类的研究相对较少,在学科评估的文本分类实践中,中国医学科学院推出的STEM研究先后利用词表匹配和基于机器学习的文本分类方法开展临床医学学科文本数据的分类工作,词表匹配方法存在学科词表构建难度大、时间成本高等问题。基于机器学习的文本分类算法存在不考虑词的语义关系,特征工程过程中会损失分类信息且模型的计算能力不足等问题。这些问题导致STEM研究中文本分类的整体分类性能不佳且相似学科容易彼此错分。考虑到深度学习方法在文本分类研究中被广泛运用,且在新闻语料、社交网站评论语料等语料集上比基于机器学习的文...

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

图1.基于混合深度学习模型的临床医学学科文本分类研宄技术路线图??1.5论文组织结构??本研究分为六个章节,具体结构安排及内容如下:??

图1.基于混合深度学习模型的临床医学学科文本分类研宄技术路线图??1.5论文组织结构??本研究分为六个章节,具体结构安排及内容如下:??

—…??j??II?数据筛癣文本预处理及文本表乐?|?;??I??r?——:zz;??I?l?i?(对比分析法)??j1?混合深度学习模型分类器实现|?|?邀于支持向恿机的分类器实现1j??I??!?i?;?j?(实折法)??|?多分类性能评估与对比?丨??:?]?I??j?二分....


图2.文本分类流程图??

图2.文本分类流程图??

?北京协和医学院???I??I????训练集文本I?^?^?*分类器??- ̄I?文特?I调??¥?本征?节??1?表降?丨I??,1?|]?I?示维?1数????测试集文本1^? ̄ ̄*分类器^效果评估?????一???....????图2.文本分类流程图??2.1.1文本预处理?....


图3.K-近邻算法7K意图??

图3.K-近邻算法7K意图??

?北京协和医学院???:e)??图3.K-近邻算法7K意图??(2)?DT算法??决策树算法利用归纳算法构建一颗决策树来挖掘训练集文本中包含的分类??规则。该算法是一种树结构,其中每个非叶节点表示对某个特征项的测试(有无??该特征项或者该特征项的权重值),而叶节点表示一个类别,从....


图4.?CBOW模型和Skip_gram模型结构示意图??以CBOW模型的训练过程为例,训练语料中的所有词构成一个词典,设一??

图4.?CBOW模型和Skip_gram模型结构示意图??以CBOW模型的训练过程为例,训练语料中的所有词构成一个词典,设一??

院???量并首尾相连形成新的向量作为模型的输入,输出则是长度为词典大小的向量,??向量中每一维的数值就是该维度映射在词典中的对应词语的得分,词向量只是神??经网络语言模型在求解过程中的副产品,但其却包含丰富的语义关系。??Word2vec词向量生成工具也是利用浅层神经网络模型预测....



本文编号:3984858

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3984858.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户63535***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com