当前位置:主页 > 外语论文 > 英语论文 >

语言学领域多语种本体知识库构建与新术语发现

发布时间:2021-08-17 14:44
  针对语言学术语使用缺少规范、领域知识有待梳理的问题,本文首先通过整合语言学领域英俄汉术语资源,构建了多语种术语表;其次,基于维基百科采集与术语相关的多语种可比语料并建库,使用知识本体方法构建了包含14个大类、75个子类、25,385个实例以及16个属性关系的语言学领域知识库;最后,统计术语构成模式,抽取新多词术语以实现对知识库的迭代更新。本文不仅对于术语翻译、词典编撰、语言学知识挖掘、多语种语料库研究有重要意义,知识库也可作为重要基础数据资源应用于其他语言学研究中。 

【文章来源】:外语电化教学. 2020,(03)北大核心CSSCI

【文章页数】:9 页

【部分图文】:

语言学领域多语种本体知识库构建与新术语发现


基于词典与可比语料的多语种知识库构建

知识库,术语,俄文,语料


第一阶段,多语种知识库构建(见图1):第一步,以中文、英文和俄文语言学词典为基础,构建对照术语词表;第二步,依照术语词表查询维基百科的多语言词目网页,获取网页正文得到对应的中英俄可比语料,可比依据为词目对应(即语料主题相同);第三步,依照语言学词典中的术语和知识分类体系,使用Protégé(4)本体构建工具,建立多语种语言学知识库,包含概念类、子类、实例和属性关系;第四步,通过本体中的对象属性关联中文、英文和俄文术语概念实例,并将术语对应的语料文本录入知识库中。第二阶段,新术语发现(见图2):第一步,将知识库中由英文和俄文中单个词构成的术语作为种子术语,并给出相应的中文术语后建表;第二步,通过知识库中已有的英文和俄文多词术语,统计分析其搭配结构及构成方法,分别建立多词术语的匹配模式;第三步,利用种子术语定位英文和俄文可比语料中的抽取节点,依照匹配模式抽取多词组合;第四步,将抽取的多词组合与知识库中已有术语进行匹配查重,如未查询到匹配结果则认定为候选新术语,加入候选库审定后得到单语种新术语。

语言学,体系,总论,语音学


本体概念类及其子类包括:理论语言学类(学派、理论与方法、核心术语、交叉学科)、文字学类(文字学总论、汉字结构、汉字起源与发展、汉字系统内部关系、汉字形体)、语音学类(发音语音学、汉语语音学、听觉语音学、声学语音学、一般语音学、音系学)、语法学(语法学总论、词法、句法、篇章)、词汇学(词汇学总论、词与词汇、词义、构词法、构词单位、造词法、熟语)、辞书学(辞书学总论、辞书编撰、辞书类型、辞书释义、辞书现代化)、方言学(方言分区、方言分析、方言调查、方言学总论)、修辞学(修辞、修辞方法、修辞手段、修辞学总论、语境、语体与风格)、社会语言学(社会语言学总论、语音变异、言语交际、语言接触与双语、语言规划、语言教育)、民族语言学(民族语言文字、民族语言学总论、南岛语系、南亚语系、汉藏语系、阿尔泰语系、朝鲜语、印欧语系)、语义学(语义词义分析法、语义学与语义理论)、音韵学(音韵学总论、音类分析和等韵学、音类演变和对音、用韵分析和今音学、语音通转和古音学)、计算语言学(计算语言学总论、字处理、词处理、句处理、语篇处理、形式化方法、算法、理论与模型、应用系统、机器翻译、语言资源)、训诂学(汉字政策、训诂方法与禁忌、训诂字词句音义关系、训诂体式、训诂学总论、训释)。图4 多语种映射关系及知识库实例示例

【参考文献】:
期刊论文
[1]基于多语言本体的中英跨语言信息检索模型及实现[J]. 司莉,陈雨雪,曾粤亮.  图书情报工作. 2017(01)
[2]基于知识库和主题爬虫的南海舆情实时监测研究[J]. 丁晟春,龚思兰,周文杰,王曰芬.  情报杂志. 2016(05)
[3]基于多语言领域本体的知识挖掘研究[J]. 司莉,李鑫.  图书馆论坛. 2016(02)
[4]语言学术语翻译标准新探——兼谈术语翻译的系统经济律[J]. 胡叶,魏向清.  中国翻译. 2014(04)
[5]语言学术语的译名变异——兼评《语言学名词》[J]. 方小兵.  辞书研究. 2014(01)
[6]基于本体的医学术语服务系统的设计与实现[J]. 杨虎,王立军,黄永峰.  计算机工程与科学. 2013(12)
[7]基于术语部件的领域本体自动构建方法研究——以教育技术学领域本体构建为例[J]. 魏顺平.  电化教育研究. 2013(05)
[8]融入形态特征的英语多词术语自动抽取研究[J]. 邓耀臣,王健刚.  外语电化教学. 2013(02)
[9]语言学中一个不容忽视的学科:术语学[J]. 冯志伟.  山东外语教学. 2012(06)
[10]俄语计算语言学领域本体知识库的构建[J]. 原伟,易绵竹.  解放军外国语学院学报. 2012(01)

硕士论文
[1]基于本体的维吾尔语语义搜索引擎的研究与实现[D]. 沙吾提江·亚森.电子科技大学 2015



本文编号:3347961

资料下载
论文发表

本文链接:https://www.wllwen.com/waiyulunwen/yingyulunwen/3347961.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户26d4e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com