基于语料库的海事英语术语提取研究
发布时间:2021-05-22 18:22
术语是知识体系的核心成员,是学科知识的集中体现,通过术语了解学科发展动态是一种行之有效的方法。术语提取技术是大规模本体工程自动或半自动构建、扩充的关键技术之一。近年来,人们已经认识到了术语提取方法的重要性,并进行了大量研究。目前,所采用的术语提取思想主要分为基于统计的、基于规则的和规则与统计相结合的方法,这些思想为术语提取方法作出了重要贡献,然而,不同术语提取方法的效度有着明显的区别。本文以语料库为基础,提出了一种基于语域限定的术语提取方法。通过研究所提术语提取方法的准确度和召回率,并与以往术语提取方法的效度进行比较,揭示和验证了本文所提方法的行之有效性。通过使用NEC、BNC和Foxpro等数据库和软件,本研究探讨了检验术语提取方法效度的参数,提出了基于语域限定的术语提取方法,建立了航海英语术语词表。研究结果表明:精确度和召回率是检验术语提取方法最重要的两个参数,并且本文所提术语提取方法,比以往基于频率的方法,具有更高的精确度和召回率。其中,以往术语提取方法的精确度和召回率分辨为88.6%和45.0%,而本文所提出方法的术语提取精确度和召回率达到了90.4%和85.4%,分别提高了1...
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
List of AbbreViatiolls
List of Tables and Figures
Chapter 1 Introduction
1.1 Research Background
1.2 Significance of the Study
1.3 Research Questions
1.4 Layout of the Thesis
Chapter 2 Literature Review
2.1 Aspects of Terminology
2.1.1 Definition of Terminology
2.1.2 Origins of Terminology
2.1.3 The Development of Terminology
2.1.4 The Evolution of Modern Terminology
2.2 The Relationship between Terms and Words
2.3 Previous Studies on Terminology Extraction
2.3.1 Standard Approaches
2.3.1.1 Linguistic Approaches
2.3.1.2 Statistical Approaches
2.3.1.3 Hybrid Approaches
2.3.2 Non-standard Approaches
2.3.2.1 Fujii and Ishikawa's Approach
2.3.2.2 Pearson's Approach
2.3.2.3 Valderrabanos,Belskis and Iraola's Approach
Chapter 3 Research Methodology
3.1 Corpora Used in the Study
3.2 The Proposed Approach
3.3 Tools for Data Processing
3.4 Procedures for Data Analysis
Chapter 4 Results and Discussion
4.1 Efficiency of the Proposed Approach
4.1.1 Precision
4.1.2 Recall
4.2 Comparison with Previous Approach
4.2.1 Precision
4.2.2 Recall
4.3 Discussion
Chapter 5 Conclusion
5.1 Major Findings of the Study
5.2 Implications
5.2.1 Theoretical Implications
5.2.2 Practical Implications
5.3 Limitations
5.4 Suggestions for Further Study
References
Appendix Ⅰ High Frequency Nautical Terms
Appendix Ⅱ Foxpro program for selecting shared terms
Appendix Ⅲ Foxpro program for the significance test of NEC and BNC
Acknowledgements
Resume
【参考文献】:
期刊论文
[1]小型英汉平行语料库的建立与运用[J]. 谢家成. 解放军外国语学院学报. 2004(03)
[2]EBMT系统中的多词单元翻译词典获取研究[J]. 程洁,杜利民. 中文信息学报. 2004(01)
[3]信息领域汉英术语的特征及其在语料中的分布规律[J]. 邢红兵. 术语标准化与信息技术. 2000(03)
[4]汉语词语边界自动划分的模型与算法[J]. 付国宏,王晓龙. 计算机研究与发展. 1999(09)
[5]语料库研究的层面和方法述评[J]. 何安平. 外国语(上海外国语大学学报). 1999(02)
[6]术语学与术语标准化(三)[J]. 粟武宾,于欣丽. 术语标准化与信息技术. 1996(04)
硕士论文
[1]汉语动宾搭配的自动识别研究[D]. 高建忠.北京语言文化大学 2000
本文编号:3201463
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
List of AbbreViatiolls
List of Tables and Figures
Chapter 1 Introduction
1.1 Research Background
1.2 Significance of the Study
1.3 Research Questions
1.4 Layout of the Thesis
Chapter 2 Literature Review
2.1 Aspects of Terminology
2.1.1 Definition of Terminology
2.1.2 Origins of Terminology
2.1.3 The Development of Terminology
2.1.4 The Evolution of Modern Terminology
2.2 The Relationship between Terms and Words
2.3 Previous Studies on Terminology Extraction
2.3.1 Standard Approaches
2.3.1.1 Linguistic Approaches
2.3.1.2 Statistical Approaches
2.3.1.3 Hybrid Approaches
2.3.2 Non-standard Approaches
2.3.2.1 Fujii and Ishikawa's Approach
2.3.2.2 Pearson's Approach
2.3.2.3 Valderrabanos,Belskis and Iraola's Approach
Chapter 3 Research Methodology
3.1 Corpora Used in the Study
3.2 The Proposed Approach
3.3 Tools for Data Processing
3.4 Procedures for Data Analysis
Chapter 4 Results and Discussion
4.1 Efficiency of the Proposed Approach
4.1.1 Precision
4.1.2 Recall
4.2 Comparison with Previous Approach
4.2.1 Precision
4.2.2 Recall
4.3 Discussion
Chapter 5 Conclusion
5.1 Major Findings of the Study
5.2 Implications
5.2.1 Theoretical Implications
5.2.2 Practical Implications
5.3 Limitations
5.4 Suggestions for Further Study
References
Appendix Ⅰ High Frequency Nautical Terms
Appendix Ⅱ Foxpro program for selecting shared terms
Appendix Ⅲ Foxpro program for the significance test of NEC and BNC
Acknowledgements
Resume
【参考文献】:
期刊论文
[1]小型英汉平行语料库的建立与运用[J]. 谢家成. 解放军外国语学院学报. 2004(03)
[2]EBMT系统中的多词单元翻译词典获取研究[J]. 程洁,杜利民. 中文信息学报. 2004(01)
[3]信息领域汉英术语的特征及其在语料中的分布规律[J]. 邢红兵. 术语标准化与信息技术. 2000(03)
[4]汉语词语边界自动划分的模型与算法[J]. 付国宏,王晓龙. 计算机研究与发展. 1999(09)
[5]语料库研究的层面和方法述评[J]. 何安平. 外国语(上海外国语大学学报). 1999(02)
[6]术语学与术语标准化(三)[J]. 粟武宾,于欣丽. 术语标准化与信息技术. 1996(04)
硕士论文
[1]汉语动宾搭配的自动识别研究[D]. 高建忠.北京语言文化大学 2000
本文编号:3201463
本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/3201463.html