当前位置:主页 > 文艺论文 > 汉语言论文 >

藏文字频统计系统中字构件分解算法

发布时间:2018-11-23 21:06
【摘要】:藏文字频统计是藏文信息处理的基础性工作,通过对藏文字的部件、音节、结构和字的频度与通用度等定量统计与定性分析,为藏文信息处理提供基础数据。藏文字是一种由藏文字构件横向和纵向组合而成的拼音文字,在藏文字频统计中不仅要从整字角度统计分析藏文字频度属性,还要统计分析构成其构件的频度及位置属性。因此,在藏文字频统计系统中要分解构成藏文字的各部件。本文通过开发藏文字频统计系统,利用组合构件库结合藏文文法提出了一种藏文字构件分解算法。经测试,该算法不仅简单易行,而且可以有效地确定出各基本构件的位置特征,已应用于项目藏文字频统计系统。
[Abstract]:The frequency statistics of Tibetan characters is the basic work of Tibetan information processing. Through quantitative statistics and qualitative analysis of components, syllables, structures, frequency and generality of Tibetan characters, this paper provides basic data for Tibetan information processing. Tibetan character is a kind of phonetic character composed of horizontal and vertical components of Tibetan characters. In the statistics of Tibetan characters frequency, not only the frequency attributes of Tibetan characters should be statistically analyzed from the perspective of whole characters, but also the frequency and position attributes of the components should be statistically analyzed. Therefore, in the Tibetan character frequency statistical system, the components that constitute Tibetan characters should be decomposed. In this paper, a component decomposition algorithm of Tibetan characters is proposed by developing the Tibetan character frequency statistics system and combining the combination component library with Tibetan grammar. The test results show that the algorithm is not only simple but also can effectively determine the location characteristics of the basic components. It has been applied to the project Tibetan character frequency statistics system.
【作者单位】: 青海师范大学藏文信息研究中心;
【基金】:国家社科基金资助项目(09XYY024) 青海师范大学科研基金资助项目
【分类号】:H214;H08

【参考文献】

相关期刊论文 前5条

1 高定国,龚育昌;现代藏字全集的属性统计研究[J];中文信息学报;2005年01期

2 卢亚军;;藏文计算机通用键盘布局与输入法研究[J];中文信息学报;2006年02期

3 陈玉忠,俞士汶;藏文信息处理技术的研究现状与展望[J];中国藏学;2003年04期

4 江荻;;现代藏语动词的句法语义分类及相关语法句式[J];中文信息学报;2006年01期

5 才智杰;藏汉英电子词典的开发研究[J];青海师范大学学报(自然科学版);2005年02期

【共引文献】

相关期刊论文 前6条

1 卢亚军;;藏文计算机通用键盘布局与输入法研究[J];中文信息学报;2006年02期

2 江荻;现代藏语组块分词的方法与过程[J];民族语文;2003年04期

3 张国喜;英藏命名实体在机器翻译系统的实现[J];青海师范大学学报(自然科学版);2004年03期

4 陈丽娜;祁坤钰;贾彦民;吴健;康丽;;藏文拉丁转写的研究与实现[J];计算机工程与设计;2006年01期

5 刘涛;杨秀霞;;中国多民族文字信息处理中的Unicode编程[J];计算机工程与设计;2006年11期

6 格桑多吉;强巴;;OpenType技术在藏文字库中的应用[J];西藏大学学报(汉文版);2006年03期

相关会议论文 前6条

1 高定国;龚育昌;;设计OpenType藏文白体字库的技术研究[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年

2 江荻;;藏语文本信息处理的历程与进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

3 江荻;;藏语语法词典的构建方法:词条与文本互动[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

4 刘汇丹;芮建武;吴健;;藏文网页的编码识别与转换[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

5 才智杰;索南仁欠;;藏文分词算法研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

6 江荻;;藏语动词的及物性、自主性与施格语言类型[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

相关博士学位论文 前1条

1 李培峰;基于语义的多文种信息处理平台SMIPP的研究[D];苏州大学;2006年

相关硕士学位论文 前2条

1 刘涛;藏文数字图书馆的研究与实践[D];湖南大学;2005年

2 李刚;印刷体藏文识别系统的研究与实现[D];上海交通大学;2007年

【二级参考文献】

相关期刊论文 前10条

1 陈玉忠,俞士汶;藏文信息处理技术的研究现状与展望[J];中国藏学;2003年04期

2 谷文祥;关于计算机汉字信息输入处理的一个新模型[J];计算机研究与发展;1995年07期

3 王浩军,赵南元,邓钢轶;藏文识别的预处理[J];计算机工程;2001年09期

4 王维兰;现代藏文语言单位频率和频级关系的统计分析[J];科学技术与工程;2004年05期

5 于江苏,葛小冲;计算机藏文信息处理的研究与设计[J];中文信息学报;1988年01期

6 钱培德;计算机汉字I/O处理的数学模型[J];中文信息学报;1992年02期

7 许嘉璐;现状和设想——试论中文信息处理与现代汉语研究[J];中文信息学报;2001年02期

8 王浩军,赵南元,邓钢轶;一种现代藏文笔段提取算法[J];中文信息学报;2001年04期

9 王维兰,丁晓青,祁坤钰;藏文识别中相似字丁的区分研究[J];中文信息学报;2002年04期

10 陈玉忠,李保利,俞士汶;藏文自动分词系统的设计与实现[J];中文信息学报;2003年03期

相关会议论文 前3条

1 陈玉忠;李保利;俞士汶;兰措吉;;基于格助词和接续特征的藏文自动分词方案[A];第一届学生计算语言学研讨会论文集[C];2002年

2 黄行;江荻;;现代藏语判定动词句主宾语的自动识别方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

3 陈玉忠;李保利;俞士汶;;基于格关系和配价的藏语动词再分类研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

【相似文献】

相关期刊论文 前10条

1 郑发奋;;二胡构件改革探究[J];齐鲁艺苑;2010年02期

2 刘志基;;简论甲骨文字频的两端集中现象[J];语言研究;2010年04期

3 邬星波;陈晓亮;;谈日用陶瓷造型中的构件——盖子[J];艺术教育;2009年01期

4 李利芳;;魏晋南北朝碑刻文字中构件“一”的替代例释[J];乐山师范学院学报;2009年04期

5 杨怀源;;构件功能变化对古汉语单音节词书写形式的影响[J];内江师范学院学报;2009年07期

6 刘志基;;字频视角的古文字“四书”分布发展研究[J];古汉语研究;2009年04期

7 焦南峰;王保平;马永赢;李岗;杨武站;曹龙;赵西晨;刘君幸;;汉阳陵帝陵东侧11~21号外藏坑发掘简报[J];考古与文物;2008年03期

8 凌村;;邂逅徽州三雕之美[J];绿色视野;2008年12期

9 吕琳;;产品的拆装式设计[J];美术大观;2007年01期

10 西方;周贵生;欧阳倩;;幽幽泰顺 悠悠廊桥(上)[J];知识就是力量;2007年03期

相关会议论文 前10条

1 郭彦兵;童彦刚;贺晓娜;邓德安;;低合金钢薄板件TIG焊温度分布特点的有限元分析[A];2010年重庆市机械工程学会学术年会论文集[C];2010年

2 王永贵;梁宪珠;;复合材料整体结构与整体成形技术[A];复合材料:创新与可持续发展(上册)[C];2010年

3 蒋云;周光明;王新峰;;三维机织复合材料中纤维束真实轨迹的研究[A];复合材料:创新与可持续发展(下册)[C];2010年

4 罗征;周新贵;于海蛟;王洪磊;赵爽;孙科;;三维C/SiC复合材料构件有限元热耦合分析及结构优化[A];复合材料:创新与可持续发展(下册)[C];2010年

5 杜善义;肖加余;;序[A];复合材料:创新与可持续发展(上册)[C];2010年

6 郭书良;段跃新;肇研;罗云烽;;抗撞击复合材料某构件成型工艺及模具设计研究[A];复合材料:创新与可持续发展(上册)[C];2010年

7 匡载平;戴棣;王雪明;;热隔膜成型技术[A];复合材料:创新与可持续发展(上册)[C];2010年

8 朱春阳;陈忱;李威;赵颖华;;CFRP-钢管混凝土柱抗冲击性能仿真分析[A];复合材料:创新与可持续发展(下册)[C];2010年

9 赵磊;徐士华;赵国生;;基于Wright的SA级测试路径生成方法[A];第六届中国测试学术会议论文集[C];2010年

10 袁玉国;安礼友;杨廷佳;于宝利;赵俊辉;曹玉娟;成勇;;含双筛选基因的人乳铁蛋白乳腺特异表达载体的构建及其表达[A];中国畜牧兽医学会2010年学术年会——第二届中国兽医临床大会论文集(下册)[C];2010年

相关重要报纸文章 前10条

1 通讯员 祝汉国 记者 耿建扩;元代察罕脑儿行宫遗址范围基本确定[N];光明日报;2011年

2 通讯员 祝汉国 记者 耿建扩;元代察罕脑儿行宫遗址范围基本确定[N];光明日报;2011年

3 记者 潘国义;新津桃城携手办会 谋产业发展[N];成都日报;2011年

4 实习记者 李思凡;1.5亿管片项目护航地铁[N];昆明日报;2011年

5 李光玉;从平面立体思维到网状体系思维[N];解放军报;2011年

6 通讯员 王路 记者 严红枫;千年保国寺维修再创传奇[N];光明日报;2011年

7 记者 李国斌 通讯员 殷军德;古湘江江堤遗迹 现身长沙万达工地[N];湖南日报;2011年

8 本报记者 甘勃 吴明 宋柯;房子也能流水线“生产”[N];大众科技报;2010年

9 记者 张Z,

本文编号:2352704


资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/2352704.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e94b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com