深加工中古汉语语料库建设的若干问题
本文选题:中古汉语 + 汉语史 ; 参考:《西南大学学报(社会科学版)》2014年03期
【摘要】:根据中古汉语的基本特点,结合现有语料库的建设经验,阐述中古汉语语料库选取语料的若干原则:语料样本的代表性、文本类型的平衡性、语料之间的关联性与区别度、入库文献的特色性;讨论建立中古汉语语料库分词规范、分词词表的可行性,初步构建"信息处理用中古汉语分词规范"的整体框架。
[Abstract]:According to the basic characteristics of the middle ancient Chinese language and the construction experience of the existing corpus, this paper expounds some principles of selecting the corpus: the representativeness of the sample, the balance of the text type, the relevance and the difference between the data. This paper discusses the characteristics of the documents in the database, discusses the feasibility of establishing the word segmentation standard and lexical table of the middle ancient Chinese corpus, and preliminarily constructs the whole frame of the "Standard for Middle Ancient Chinese word Segmentation for Information processing".
【作者单位】: 南京师范大学文学院;
【基金】:国家社会科学基金重大项目“汉语史语料库建设研究”(10&ZD117),项目负责人:董志翘 教育部人文社会科学规划项目“中古近代农业俗词语研究”(10YJA740033),项目负责人:化振红
【分类号】:H109.2
【参考文献】
相关期刊论文 前3条
1 黄昌宁;赵海;;中文分词十年回顾[J];中文信息学报;2007年03期
2 ;信息处理用现代汉语词类标记集规范[J];语言文字应用;2001年03期
3 靳光瑾,郭曙纶,肖航,章云帆;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[J];语言文字应用;2003年04期
【共引文献】
相关期刊论文 前10条
1 袁健惠;;先秦汉语受事前置句类型及其句法语义分析[J];安徽大学学报(哲学社会科学版);2010年02期
2 张国艳;;居延汉简否定副词的平面描写[J];合肥师范学院学报;2008年02期
3 谭黎明;;论隋唐五代时期农业科学发展[J];安徽农业科学;2009年07期
4 曾令香;;《农桑衣食撮要》中的新农业生产技术和经验探讨[J];安徽农业科学;2011年33期
5 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期
6 杨尔弘;;媒体5年词语使用情况调查分析[J];北华大学学报(社会科学版);2011年04期
7 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
8 索娟娟;;信息时代计算语言学在英语教学中的应用[J];毕节学院学报;2008年01期
9 李昊;《焦氏易林》中的“徒自、还自”及副词词尾“自”的演变[J];成都大学学报(社会科学版);2005年02期
10 孙洪伟;;《左传》中动词“谓”的语义和句法特点[J];长江学术;2008年02期
相关会议论文 前10条
1 李金;宋阳;梁洪;;语言残障患者医疗辅助系统设计[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年
2 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
6 靳光瑾;富丽;;中文语料库建设——标准制定和质量检查[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
7 肖航;靳光瑾;;现代汉语词语切分歧义库构建[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
8 李玉梅;靳光瑾;黄昌宁;;中文分词规范中的歧义字段消解细则[A];第五届全国语言文字应用学术研讨会论文集[C];2007年
9 蔡红录;周静;;古汉语语法和语序研究综述[A];江西省语言学会2006年年会论文集[C];2006年
10 满正行;高璐;;藏语单语料库分析及标注探讨[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
相关博士学位论文 前10条
1 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
2 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
3 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
4 张成福;唐宋农民比较研究[D];山东大学;2011年
5 宋琳;基于《汉语大词典》语料库的魏晋新词语研究[D];山东大学;2011年
6 周启梁;中国古代环境保护法制演变考[D];重庆大学;2011年
7 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
8 熊帝兵;中国古代农家文化研究[D];南京农业大学;2010年
9 龚光明;中国古代害虫观念与防治技术研究[D];南京农业大学;2010年
10 胡安徽;历史时期武陵山区药材产地分布变迁研究(618-1840)[D];西南大学;2011年
【二级参考文献】
相关期刊论文 前7条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 杨尔弘;方莹;刘冬明;乔羽;;汉语自动分词和词性标注评测[J];中文信息学报;2006年01期
3 ;信息处理用现代汉语词类标记集规范[J];语言文字应用;2001年03期
4 孙茂松,王洪君,李行健,富丽,黄昌宁,陈松岑,谢自立,张卫国;《信息处理用词汇研究》九五项目结题汇报 信息处理用现代汉语分词词表[J];语言文字应用;2001年04期
5 黄昌宁;中文信息处理中的分词问题[J];语言文字应用;1997年01期
6 刘开瑛;现代汉语自动分词评测技术研究[J];语言文字应用;1997年01期
7 孙茂松;谈谈汉语分词语料库的一致性问题[J];语言文字应用;1999年02期
【相似文献】
相关期刊论文 前10条
1 刘小勇;;试论佛学东渐对中古汉语词汇的影响[J];西安外国语学院学报;2006年04期
2 ;第五届中古汉语国际学术研讨会在芜湖召开[J];中国语文;2006年02期
3 赵文源;;关于中古汉语里的“脸”[J];语言研究;2009年04期
4 蒋瑜林;;第八届中古汉语国际学术研讨会会议纪要[J];古汉语研究;2012年02期
5 本刊记者;;第八届中古汉语国际学术研讨会在湖南师范大学举行[J];语言科学;2012年05期
6 贾清妍;;近二十年中古汉语复音词研究综述[J];吉林广播电视大学学报;2013年01期
7 刘坚;《中古汉语读本》序[J];古汉语研究;1992年04期
8 王小莘;试论中古汉语词汇的同步引申现象[J];南开学报;1998年04期
9 宋闻兵;;中古汉语人物容貌“美丑”类词语探析[J];宁波大学学报(人文科学版);2014年01期
10 胡敕瑞;;中古汉语语料鉴别述要[J];汉语史学报;2005年00期
相关博士学位论文 前3条
1 解植永;中古汉语判断句研究[D];四川大学;2007年
2 郑丽;中古汉语主从连词研究[D];福建师范大学;2009年
3 季忠平;中古汉语雅言词研究[D];复旦大学;2007年
相关硕士学位论文 前10条
1 成果;中古汉语“短暂”义时间词研究[D];广州大学;2013年
2 桂云;中古汉语感叹句研究[D];苏州大学;2011年
3 刘芊;中古汉语有标转折复句研究[D];苏州大学;2014年
4 罗素珍;中古汉语语气词专题研究[D];南京师范大学;2007年
5 江蓉蓉;中古汉语静态句研究[D];苏州大学;2013年
6 刘芳;中古汉语致动式“使”字句研究[D];辽宁师范大学;2008年
7 王岩;中古汉语的“著”及相关问题研究[D];西南交通大学;2010年
8 张yN;中古汉语兼语句研究[D];苏州大学;2013年
9 陶畅;中古汉语表示比较的方字句[D];上海师范大学;2007年
10 王家璐;中古汉语人体感官感知类形容词语义场研究[D];宁波大学;2011年
,本文编号:1810187
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/1810187.html