用于双语术语抽取的专业领域中英文可比语料库构建
本文关键词: 可比语料库 语料库构建 双语术语抽取 出处:《现代图书情报技术》2012年02期 论文类型:期刊论文
【摘要】:面向双语术语抽取这一应用目标,提出专业领域可比语料库的构建方案并进行实验论证。针对给定的主题领域分别进行中英文专业语料的采集,从中分别获取中英文关键词,根据词语共现统计获取该主题领域的其他相关关键词;以这些关键词作为查询入口,通过学术搜索引擎从网络获取候选可比语料;对可比语料进行定量评估,以剔除不符合要求的语料,最终得到特定主题领域的可比语料库。
[Abstract]:For the purpose of bilingual terminology extraction, this paper puts forward the construction scheme of comparable corpus of professional domain and carries on the experimental demonstration, and carries on the collection of the Chinese and English professional corpus for the given subject field, and obtains the Chinese and English key words separately from the given subject field. According to cooccurrence statistics, other relevant keywords in the subject area are obtained; those keywords are used as query entry to obtain candidate comparable corpus from the network through academic search engine; the comparative corpus is evaluated quantitatively. Finally, a comparable corpus of a specific subject area can be obtained by eliminating the nonconforming data.
【作者单位】: 南昌大学图书馆;南京理工大学信息管理系;
【基金】:国家自然科学基金项目“基于可比语料的多语言文本聚类研究”(项目编号:70903032) 南京理工大学自主科研专项计划项目“多语言标签聚类研究”(项目编号:2011ZDJH15)的研究成果之一
【分类号】:TP391.1
【参考文献】
相关期刊论文 前2条
1 孙广范;宋金平;袁琦;肖健;单玉秋;;中英可比语料库中翻译等价对抽取方法研究[J];计算机工程与应用;2007年32期
2 祝清松;王惠临;;中英文句法分析系统及验证平台的设计与实现[J];现代图书情报技术;2010年02期
【共引文献】
相关期刊论文 前2条
1 章成志;王惠临;;多语言文本聚类研究综述[J];现代图书情报技术;2009年06期
2 康小丽;章成志;王惠临;;基于可比语料库的双语术语抽取研究述评[J];现代图书情报技术;2009年10期
相关硕士学位论文 前2条
1 房璐;英汉可比较语料库的构建与应用研究[D];苏州大学;2011年
2 刘飒;专业领域可比语料的构建与评价研究[D];南京理工大学;2012年
【二级参考文献】
相关期刊论文 前2条
1 陈道达;曹冬林;李绍滋;;基于JGraph的变电站综合自动化图形组态系统[J];计算机工程;2009年07期
2 刘海涛;赵怿怡;;基于树库的汉语依存句法分析[J];模式识别与人工智能;2009年01期
【相似文献】
相关期刊论文 前10条
1 冯冠军;禹龙;田生伟;;基于CRFs自动构建维吾尔语情感词语料库[J];现代图书情报技术;2011年03期
2 孙广范;宋金平;袁琦;肖健;单玉秋;;中英可比语料库中翻译等价对抽取方法研究[J];计算机工程与应用;2007年32期
3 韩先培;赵军;;基于Wikipedia的语义元数据生成[J];中文信息学报;2009年02期
4 章成志;王惠临;;面向数字图书馆应用的多语言领域本体学习研究[J];图书情报工作;2011年02期
5 张秀梅;;论跨语言信息检索[J];情报资料工作;2006年02期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前1条
1 韩先培;赵军;;基于Wikipedia的语义元数据生成[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
相关硕士学位论文 前2条
1 林声;可比语料中命名实体翻译等价对抽取方法研究[D];大连理工大学;2009年
2 高菲;汉语翻译小说语言整齐化特征[D];西南交通大学;2011年
,本文编号:1517263
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1517263.html