当前位置:主页 > 文艺论文 > 汉语言论文 >

汉字字频统计方法的改进

发布时间:2018-08-03 17:43
【摘要】:字频统计是研究实际使用中汉字价值的一种重要方法。以往的字频统计取得了重要的成果,对汉字规范、汉字教学、汉字字典编纂、汉字信息处理以及汉字理论研究都起了重要作用。但也存在基于语料库统计字频造成字频统计结果失真;统计缺乏统一而明确的统计单位,统计结果不科学等问题。解决问题的关键在于建立满足文字统计要求的字料库,必须明确界定统计单位,划分不同层级的汉字统计单位,根据不同需要对其进行分类分层的字频统计。以印刷楷书为例,可以从描写、规定两个方面区分汉字单位。字的单位确定了,字频统计则可以根据不同的统计目的规定统计单位,便于统计数据的使用以及不同统计数据的比较,使得字频统计的科学性得到保障。
[Abstract]:Word frequency statistics is an important method to study the value of Chinese characters in practical use. In the past, important achievements have been made in the statistics of character frequency, which plays an important role in the standardization of Chinese characters, the teaching of Chinese characters, the compilation of Chinese characters dictionaries, the processing of Chinese characters' information and the study of Chinese characters' theory. However, there are also some problems such as the distortion of the word frequency statistics based on the corpus, the lack of unified and definite statistical units and the unscientific statistical results. The key to solve the problem lies in the establishment of a character database that meets the requirements of character statistics. The statistical units must be clearly defined, the Chinese character statistics units of different levels should be divided, and the word frequency statistics should be classified and stratified according to different needs. Take printing regular script as an example, we can distinguish the Chinese character unit from the description, the stipulation two aspects. The word frequency statistics can be defined according to different statistical purposes, which is convenient for the use of statistical data and the comparison of different statistical data, so that the scientific nature of word frequency statistics can be guaranteed.
【作者单位】: 北京师范大学民俗典籍文字研究中心;北京师范大学中国文字整理与规范研究中心;
【分类号】:H12

【共引文献】

相关期刊论文 前10条

1 谭沅湘;多音字的语文教学应用角度考察及“以字为本”原理[J];北京教育学院学报;2004年02期

2 齐元涛;隋唐五代碑志楷书书写、构形状况论析[J];古汉语研究;2002年01期

3 丁安仪,郭英剑,赵云龙;应该怎样称呼现代中国的官方语言?——从英汉对比看“汉语”、“普通话”、“国语”与“华语”等概念的使用[J];河南师范大学学报(哲学社会科学版);2000年03期

4 黄宇鸿;古代汉字教学方法探索[J];广西社会科学;2004年08期

5 阚映红;地图数据库建立和应用过程中生僻汉字的处理[J];测绘学院学报;2000年01期

6 贺前华,徐秉铮,彭磊;中文文本压缩的自适应算法[J];中文信息学报;1993年03期

7 张敏,马少平;用于信息检索的古文统计分析[J];中文信息学报;2001年06期

8 江荻,,董颖红;藏文信息处理属性统计研究[J];中文信息学报;1995年02期

9 王忠效;汉语文本压缩研究及其应用[J];中文信息学报;1997年03期

10 古敬恒;楚简遣策丝织品字词考辨[J];徐州师范大学学报(哲学社会科学版);2002年02期

相关会议论文 前3条

1 周有光;;关于现代汉字学[A];第一届国际汉语教学讨论会论文选[C];1985年

2 贺前华;徐秉铮;;神经网络在汉语自动分词中的应用[A];第二届全国人机语音通讯学术会议论文集[C];1992年

3 殷平善;;中医药专业语文素质的培育及医古文多媒体教学[A];中华中医药学会第十六届医古文学术会议论文集[C];2006年

相关博士学位论文 前7条

1 韩同兰;战国楚文字用字调查[D];华东师范大学;2003年

2 周建忠;屈原考古新证[D];上海师范大学;2004年

3 康少峰;《诗论》简制、简序及文字释读研究[D];四川大学;2005年

4 鲁六;《荀子》词汇研究[D];山东大学;2005年

5 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年

6 韩秀娟;基于动态流通语料库的通用词语用字研究及字词语关系考察[D];北京语言大学;2007年

7 赵小东;句法规范研究[D];四川大学;2007年

相关硕士学位论文 前9条

1 房振三;信阳楚简文字研究[D];安徽大学;2003年

2 徐伟勤;汉字部首演变与记号化[D];山东师范大学;2004年

3 刘新英;当前小学识字教学的误区及对策[D];河北大学;2006年

4 王红;小学识字教科书编写体系的研究[D];首都师范大学;2006年

5 刘庆委;现代日语中汉字的类型分析及其文化特征[D];广西大学;2006年

6 张双;汉语拼音在对外汉语教学中的应用研究[D];湖南师范大学;2007年

7 吴葵;汉语拼音在对内汉语教学中的应用研究[D];湖南师范大学;2007年

8 张金莱;信息化识字写字教学模式探讨[D];四川师范大学;2007年

9 林荣钦;从隶楷演化的情况看汉字发展的简化趋势[D];福建师范大学;2007年

【相似文献】

相关期刊论文 前10条

1 刘志基;;简论甲骨文字频的两端集中现象[J];语言研究;2010年04期

2 李国英;周晓文;;字料库建设的必要性与可行性[J];北京师范大学学报(社会科学版);2009年05期

3 才让卓玛;才智杰;;藏文字频统计系统中字构件分解算法[J];计算机工程与科学;2011年03期

4 刘志基;;字频视角的古文字“四书”分布发展研究[J];古汉语研究;2009年04期

5 王惠;余桂林;;汉语基础教材的字频统计与跨区域比较——兼论全球华语区划与汉字教育问题[J];长江学术;2007年02期

6 扎西次仁;《中华大藏经·丹珠尔》藏文对勘本字频统计分析[J];中国藏学;1997年02期

7 司玉英;;从四种汉字频度的比较看汉字的性质[J];内蒙古大学学报(人文社会科学版);2006年03期

8 周毕吉;“合/阖/盍家欢乐”该用哪个?[J];语文建设;2001年08期

9 傅永和;现代汉语字频统计取得新成果[J];语文建设;1985年03期

10 王敏;;新中国常用字问题研究概述[J];语言文字应用;2007年02期

相关会议论文 前1条

1 “汉字应用水平测试研究”课题组 ;孙曼均;;汉字应用水平测试用字的统计与分级[A];语言文字应用研究论文集(Ⅱ)[C];2004年

相关硕士学位论文 前10条

1 陈丹丹;四大名著字频研究[D];曲阜师范大学;2012年

2 韩晓川;《甲骨文合集补编》第四、五期文字基础整理与初步研究[D];苏州大学;2012年

3 刘芹芹;古今汉语前200个高频字字频变化研究[D];渤海大学;2013年

4 王晓红;《甲骨文合集补编》第二、三期文字基础整理与研究[D];苏州大学;2012年

5 李思栋;《小屯南地甲骨》文字的基础整理与研究[D];苏州大学;2010年

6 赵玉艳;《甲骨文合集补编》第一期文字基础整理与初步研究[D];苏州大学;2012年

7 刘金珠;论汉语水平汉字等级大纲的研制[D];暨南大学;2010年

8 柴艳丽;复音同义词检索与分析系统的设计与研究[D];广西民族大学;2010年

9 李清;中文文—语转换系统中多音字问题研究[D];河北大学;2010年

10 曹丛;“字本位”理念指导下的对泰汉语词汇教学设计[D];山东大学;2012年



本文编号:2162489

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/2162489.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9a1e9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com