当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于语料库的藏文字属性分析系统设计

发布时间:2018-12-26 10:12
【摘要】:通过对藏语语料库的统计和现代藏文字结构的分析,研究现代藏文字属性分析系统的模型,设计基本构件字表库、组合构件字表库、粗粒度结构字表库及细粒度结构字表库,并阐述各字表库的结构特征,介绍藏文字属性分析算法。运用该算法及藏文字属性分析系统模型,解析现代藏文字的使用频度、结构、字长、构件分解、各构件的位置及频度等属性,从而为藏文键盘布局、藏文输入法研究、藏文搜索引擎、机器翻译和网络信息安全等提供理论依据。
[Abstract]:Through the statistics of Tibetan corpus and the analysis of modern Tibetan character structure, this paper studies the model of modern Tibetan character attribute analysis system, designs the basic component word table database, the combination component word table database, the coarse grained structure word table database and the fine-grained structure word table database. The structural features of each word table database are described, and an algorithm for attribute analysis of Tibetan characters is introduced. By using this algorithm and the attribute analysis system model of Tibetan characters, the use frequency, structure, word length, component decomposition, position and frequency of each component of modern Tibetan characters are analyzed, so as to study the layout of Tibetan keyboard and the input method of Tibetan. Tibetan search engine, machine translation and network information security provide theoretical basis.
【作者单位】: 青海师范大学藏文信息处理省部共建教育部重点实验室;
【基金】:国家自然科学基金资助项目(61163018) 国家“973”计划前期研究专项基金资助项目(2010CB334708) 国家社会科学基金资助项目(09XYY024) 青海省科技厅应用基础研究计划基金资助项目(2011-Z-755) 青海师范大学科研创新计划基金资助项目,青海师范大学中青年科研基金资助项目
【分类号】:TP391.1

【参考文献】

相关期刊论文 前7条

1 扎西次仁;《中华大藏经·丹珠尔》藏文对勘本字频统计分析[J];中国藏学;1997年02期

2 才科扎西;黄景廉;;基于前缀树的高效频繁项集挖掘算法[J];计算机工程;2010年04期

3 王花;古丽拉·阿东别克;;基于语料的哈萨克语词频统计研究[J];计算机工程;2010年24期

4 高定国,龚育昌;现代藏字全集的属性统计研究[J];中文信息学报;2005年01期

5 才智杰;;藏文自动分词系统中紧缩词的识别[J];中文信息学报;2009年01期

6 才智杰;才让卓玛;;班智达藏文标注词典设计[J];中文信息学报;2010年05期

7 才让卓玛;才智杰;;现代藏文字构件分解方法[J];青海大学学报(自然科学版);2010年04期

【共引文献】

相关期刊论文 前10条

1 陈玉忠,俞士汶;藏文信息处理技术的研究现状与展望[J];中国藏学;2003年04期

2 尼玛扎西;李志蜀;拥措;群诺;普顿;;实现计算机藏文快速输入的关键问题研究[J];电子科技大学学报;2009年01期

3 罗进军;;当前计算语言学研究的发展态势[J];湖南工业职业技术学院学报;2006年04期

4 欧珠;普次仁;大罗桑朗杰;赵栋才;刘芳;边巴旺堆;;印刷体藏文文字识别技术研究[J];计算机工程与应用;2009年24期

5 才让加;;藏语语料库加工方法研究[J];计算机工程与应用;2011年06期

6 珠杰;欧珠;格桑多吉;;基于DOM修剪的藏文Web信息提取[J];计算机工程;2008年24期

7 陶克;王意洁;;数据流上的频繁闭项集挖掘算法[J];计算机工程;2010年18期

8 许晓东;李柯;朱士瑞;;Web日志中RCFA路径的挖掘方法[J];计算机工程;2010年22期

9 史建军;缪裕青;;微阵列数据中Top-k频繁闭合项集挖掘[J];计算机工程;2011年02期

10 彭学武;王黎明;;三维数据集中基于位运算的挖掘算法[J];计算机工程;2011年06期

相关会议论文 前3条

1 江荻;;藏语文本信息处理的历程与进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

2 刘汇丹;芮建武;吴健;;藏文网页的编码识别与转换[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

3 才让加;头旦才让;周毛先;;藏语语料库加工方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

相关硕士学位论文 前10条

1 何向真;多语言电子词典构建[D];西北民族大学;2010年

2 王思丽;藏文网页自动发现与采集技术研究[D];西北民族大学;2010年

3 刘涛;藏文数字图书馆的研究与实践[D];湖南大学;2005年

4 李刚;印刷体藏文识别系统的研究与实现[D];上海交通大学;2007年

5 顿珠次仁;Openoffice藏文本地化及其实现[D];西藏大学;2008年

6 尼玛扎西;汉藏在线翻译多媒体电子词典设计研究与实现[D];西藏大学;2008年

7 边巴旺堆;基于ISO/IEC10646藏文编码字符集标准的藏文排序算法设计与实现[D];西藏大学;2009年

8 春燕;藏文编码识别与转换算法的研究与实现[D];西南交通大学;2010年

9 普布旦增;藏文自动分词技术方法研究[D];西藏大学;2010年

10 官却多杰;汉藏辅助翻译研究与实现[D];西藏大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 陈玉忠,俞士汶;藏文信息处理技术的研究现状与展望[J];中国藏学;2003年04期

2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期

3 刘艳;古丽拉.阿东别克;伊力亚尔;;哈萨克语词性自动标注研究初探[J];计算机工程与应用;2008年20期

4 曹洪其;姜志峰;孙志挥;;基于FP-tree的多层关联规则快速挖掘算法[J];计算机工程;2007年19期

5 张艳;石磊;卫琳;;Web缓存优化模型研究[J];计算机工程;2009年08期

6 熊忠阳;付玲玲;张玉芳;蒋健;;结合语义的特征选择方法[J];计算机应用;2010年10期

7 江荻,周季文;论藏文的序性及排序方法[J];中文信息学报;2000年01期

8 王浩军,赵南元,邓钢轶;一种现代藏文笔段提取算法[J];中文信息学报;2001年04期

9 陈玉忠,李保利,俞士汶;藏文自动分词系统的设计与实现[J];中文信息学报;2003年03期

10 李庆虎,陈玉健,孙家广;一种中文分词词典新机制——双字哈希机制[J];中文信息学报;2003年04期

【相似文献】

相关期刊论文 前10条

1 扎西加;高定国;;藏语语料库TEI标记规范探讨[J];中文信息学报;2011年04期

2 于康;;【自制语料库】第1讲 软件的下载与安装[J];日语知识;2011年08期

3 宋玉璞;刘敏;;软件构件在专家系统中的应用研究[J];价值工程;2011年20期

4 朱培焱;夏栋梁;;汉英跨语言信息检索研究[J];计算机与现代化;2011年08期

5 罗细平;;基于构件的软件工程概念模型研究[J];科技创新导报;2011年19期

6 胡莉;;中文“词”的语言模型识别研究方法综述[J];北方文学(下半月);2011年03期

7 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期

8 靳丹宁;;基于语料库调查中动词句型错误探析[J];安徽电子信息职业技术学院学报;2011年04期

9 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期

10 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期

相关会议论文 前10条

1 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年

2 梁红梅;尹晓霞;李宇庄;;有关语料库驱动下的外语在线自主学习的工作底稿[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年

3 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年

4 宋鸿彦;刘军;姚天f ;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

5 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年

6 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年

7 郭启新;;论语料库与英汉词典配例[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年

8 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年

9 蔡莲红;蔡锐;吴志勇;陶建华;;语音合成语料库的设计与声学特征分析[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

10 郭慧志;王强军;刘华;张普;;大规模动态流通语料库的构建[A];第二届全国学生计算语言学研讨会论文集[C];2004年

相关重要报纸文章 前10条

1 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年

2 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年

3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年

4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年

5 本报记者 王向华;藏文图书:发现几多雪原奇葩[N];四川日报;2009年

6 本报记者 蒋翠莲;信息化使古老藏文焕发生机[N];西藏日报;2009年

7 大山;藏文媒体发展还需加力[N];西藏日报;2009年

8 樊曦;藏文软件让藏族同胞踏上信息化“天路”[N];中国民族报;2010年

9 记者 张黎黎 晓勇;新一代藏文软件推广应用取得实质进展[N];西藏日报;2010年

10 唐大山;为传统藏文插上科技翅膀[N];西藏日报;2010年

相关博士学位论文 前10条

1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年

2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年

3 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年

4 夏云;基于语料库的英汉翻译小说常规化研究:历时的视角[D];山东大学;2010年

5 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年

6 何婷婷;语料库研究[D];华中师范大学;2003年

7 王青;基于语料库的《尤利西斯》汉译本译者风格研究[D];山东大学;2010年

8 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年

9 尹蔚;多维视域下的有标选择复句研究[D];华中师范大学;2008年

10 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年

相关硕士学位论文 前10条

1 罗丽俊;中文信息处理中若干技术的研究与实现[D];辽宁科技大学;2008年

2 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年

3 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年

4 梁文娟;汉字语法语义智能输入法搭配库设计与实现[D];河南大学;2006年

5 沈威;基于渡越矩阵与语境计算模型的复句关系词的自动标注[D];华中师范大学;2007年

6 秦健;N-gram技术在中文词法分析中的应用研究[D];中国海洋大学;2009年

7 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年

8 钱小飞;含“的”最长名词短语的自动识别[D];南京师范大学;2007年

9 罗万;基于生成性词库分词技术的汉语拼音自动转换研究[D];湖南师范大学;2009年

10 谢晓燕;基于眼动技术和动态流通语料库(DCC)的汉语阅读注视块研究[D];北京语言大学;2005年



本文编号:2391950

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2391950.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9206f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com