基于UMLS专家词典与工具的词形归并算法研究
发布时间:2017-10-01 13:37
本文关键词:基于UMLS专家词典与工具的词形归并算法研究
更多相关文章: 词形归并 UMLS专家词典 Norm原形化工具
【摘要】:在简述词形归并(原形化处理)基本目标的基础上,着重分析UMLS专家词典的构建方式与词典工具的核心功能,以及Norm原形化工具的处理机制;在此基础上,提出一种词形归并算法及Norm处理缺陷的修正办法,并收集医学词表数据进行算法测试与验证;此外,本文算法与经典的Porter算法进行了多方面的深入比较研究。
【作者单位】: 中国医学科学院医学信息研究所;
【关键词】: 词形归并 UMLS专家词典 Norm原形化工具
【基金】:国家科技支撑计划(2011BAH10B02)
【分类号】:H06;H087
【正文快照】: 1引言在语言学中,词形归并(lemmatisation或lemma tization)是指将一个词与它不同的屈折变形(inflec tion)【1】组织起来,以使它们可被视为同一个词项(Term)的过程【2】。就英语而言,由于人称、时态、语态的不同,一个单词会出现多种屈折变形;而词形归并的重点就是查找单词的,
本文编号:953794
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/953794.html