中医针灸领域信息抽取关键技术研究
发布时间:2021-06-29 00:32
近年来,在国家政策的大力扶持下,大批老中医专家的临床疾病诊疗经验通过整理和总结被保存下来,出版了大量关于中医专家疾病诊疗经验的文献和著作。随着中医针灸领域电子文档的累积,由人工阅读来获取中医针灸知识不仅费时而且人工成本极高。如何利用自然语言处理技术,从大量非结构化中医文献资料中自动获取所蕴含的专业领域信息如术语、实体关系、事件等,具有重要的理论意义和应用价值。本文针对中医针灸领域文本的特点,深入研究中医针灸信息自动抽取的关键技术,主要开展了以下几个方面的研究工作:(1)针对中医针灸领域术语的构成特点,建立了一种基于种子集的领域术语抽取算法模型,该模型首先对中医针灸领域术语种子集进行有限次的迭代,生成中医针灸领域术语构件集;其次,以术语构件集为领域词典,采用最大向前匹配算法对中文针灸医学文献中的句子进行切分,并抽取候选术语;最后,采用术语过滤算法对候选术语进行过滤处理,筛选出中医针灸领域专业术语。以关键字集为种子集进行实验,术语抽取开式测试的F值达到77.29%。(2)针对中医针灸领域实体关系实例的语境,选择有效的词汇、语法和语义特征组合成特征模板,将实体关系实例向量化。采用支持向量机的...
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:122 页
【学位级别】:博士
【部分图文】:
图1.2基于模式匹配的事件抽取系统架构图??Fi.?1.2?Pattern-matchingbased?event?extraction?system?architecture?diaram??
图1.3论文组织结构图??Fig.?1.3?Organization?chart?of?the?thesis??
图2.2中医针灸领域实体关系标注语料集构建流程??
本文编号:3255348
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:122 页
【学位级别】:博士
【部分图文】:
图1.2基于模式匹配的事件抽取系统架构图??Fi.?1.2?Pattern-matchingbased?event?extraction?system?architecture?diaram??
图1.3论文组织结构图??Fig.?1.3?Organization?chart?of?the?thesis??
图2.2中医针灸领域实体关系标注语料集构建流程??
本文编号:3255348
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3255348.html