当前位置:主页 > 文艺论文 > 语言艺术论文 >

基于依存句法分析的皮肤病实体关系抽取

发布时间:2021-06-06 11:00
  文章工作的重点是在语言学的基础上,进行多视图汉语树库的构建以及实体关系的抽取,主要的理论框架是在依存句法的基础上进行的文本挖掘工作,本文的创新点就是将依存句法树库与具体的专业知识相结合,继而在多视图汉语树库的标注平台上进行命名实体的选定以及命名实体关系的归纳总结处理,然后对各类命名实体关系进行依存句法模型的抽取,以展示皮肤病领域中实体间的语义关系。切实将理论与实际相结合,以扩大语料库、丰富语料规模、进一步拓展汉语多视图树库的应用,也使语言学对自然语言处理多作一分贡献,以期为计算机进行其他相关领域如,电子病历等临床领域的命名实体关系抽取时提供一个模板,多做一种尝试。近年来,随着自然语言处理技术的进步与成熟,大量的涉及各个领域的非结构化文本数据,例如:皮肤病、中小学教材专著、电子病历等都可以尝试进行结构化的数据处理,以方便进行文本挖掘。目前大部分的医药文本并不是结构化了的信息数据,包括许多由自然语言描述而成的复杂无结构的文本数据,虽然文本类型的信息数据能够方便详细准确地进行描述概念以及事件等内容,但是大篇幅、无结构的文本数据,同时也为搜索、统计分析等增添了负担、制造了障碍,可能会对数据分析... 

【文章来源】:鲁东大学山东省

【文章页数】:128 页

【学位级别】:硕士

【部分图文】:

基于依存句法分析的皮肤病实体关系抽取


宾州中文树库(CTB)示例

树库,示例


基于依存句法分析的皮肤病实体关系抽取标注体系为上下文无关文法①(context-free grammar, CFG),既标注了短语结构类型(NP、VP 等),还标注了短语之间的依存关系(主语、谓语等),底层成分采用语法功能标记来描写,底层结构之间的关系则采用语法结构关系来描写,句法标注还允许树分支交叉,适应德语中的自由词序现象和语料库中常见的“不完全”结构。下图是 NEGRA 树库的一个示例,介词短语和关系从句分别导致树结构有两处交叉。

基于依存句法分析的皮肤病实体关系抽取


PDT树库示例

【参考文献】:
期刊论文
[1]中文电子病历命名实体识别的主动学习方法研究[J]. 王润奇,李雪莉,黄玉丽,何彬,关毅.  中国数字医学. 2017(10)
[2]药物实体和药物相互关系的联合识别[J]. 刘奔,姬东鸿.  计算机工程与设计. 2017(05)
[3]基于依存句法分析的病理报告结构化处理方法[J]. 田驰远,陈德华,王梅,乐嘉锦.  计算机研究与发展. 2016(12)
[4]非结构化电子病历信息的抽取[J]. 倪晓华.  中国数字医学. 2016(12)
[5]基于依存树的越南语新闻事件元素抽取[J]. 周晶晶,周枫,严馨.  计算机工程与设计. 2016(08)
[6]中文电子病历命名实体和实体关系语料库构建[J]. 杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰.  软件学报. 2016(11)
[7]命名实体识别综述[J]. 陈基.  现代计算机(专业版). 2016(03)
[8]基于规则的依存树库错误自动检测与分析[J]. 史林林,邱立坤,亢世勇.  北京大学学报(自然科学版). 2016(01)
[9]基于依存语法构建多视图汉语树库[J]. 邱立坤,金澎,王厚峰.  中文信息学报. 2015(03)
[10]基于实体消歧的中文实体关系抽取[J]. 邵发,黄银阁,周兰江,郭剑毅,余正涛,张金鹏.  山东大学学报(工学版). 2014(06)

硕士论文
[1]基于深度学习的生物医学事件抽取研究[D]. 张建海.大连理工大学 2016
[2]中文医学术语资源的自动构建方法研究及应用[D]. 鞠美芝.浙江大学 2016
[3]临床文档结构化处理研究与系统实现[D]. 冯洁莹.东华大学 2016
[4]基于文本的实体—关系抽取技术研究[D]. 刘方驰.国防科学技术大学 2013
[5]基于依存树的中文命名实体语义关系抽取的研究[D]. 王苑.中南大学 2009
[6]文本病历信息抽取方法研究[D]. 李莹.浙江大学 2009
[7]中文命名实体识别及其关系抽取研究[D]. 温锐.苏州大学 2005



本文编号:3214248

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/3214248.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户89d08***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com