少数民族语言文字网站的自动识别和采集
本文选题:少数民族语言文字 + 网站 ; 参考:《计算机科学》2015年S1期
【摘要】:分析了少数民族语言文字网站的特殊性,综合采用基于特殊字符、网页标签属性和N-gram的方法对传统蒙古文、藏文、阿拉伯字母体系的维吾尔文、哈萨克文和柯尔克孜文以及彝文、新傣文、朝鲜文、俄文和壮文等10种少数民族语言文字网站进行了自动识别研究。所提方法对10种少数民族语言文字网站的平均正确识别率达到95%以上,效果令人满意。
[Abstract]:This paper analyzes the particularity of the language and language websites of ethnic minorities, and combines the methods of special characters based on special characters, web label attributes and N-gram to the traditional Mongolian, Tibetan, Arabia alphabet Uygur, Kazakhstan and Kirgiz, Yi, new Dai, Korean, Russian and Zhuang. An automatic recognition study was conducted. The average correct recognition rate of the proposed method for 10 kinds of ethnic language website is over 95%, and the result is satisfactory.
【作者单位】: 中央民族大学理学院;中央民族大学信息工程学院;中央民族大学少数民族语言文学系;
【基金】:中央民族大学2014年校级自主科研项目(2014MDLXYZY04)资助
【分类号】:TP393.092;TP391.4
【共引文献】
相关期刊论文 前2条
1 薛中奇;维尼拉·木沙江;赵丽红;;维吾尔文搜索引擎中的压缩技术[J];电脑知识与技术;2011年27期
2 戴远君;徐海;;电子词典研究现状与展望[J];辞书研究;2014年04期
【二级参考文献】
相关期刊论文 前1条
1 确精扎布,那顺乌日图;关于蒙古文编码(上)[J];内蒙古大学学报(哲学社会科学版);1994年04期
相关硕士学位论文 前1条
1 敖登巴拉;蒙古文变形显现字符到名义字符转换的研究与实现[D];内蒙古大学;2010年
【相似文献】
相关期刊论文 前10条
1 魏传忠,伦立广,杨杰,田恩深,康燕龄,赵良刚,刘艳华,陈亦农,徐波,李成荣,张翠凤,杨永良,屈韶琳,夏明磊,曹杰文,李峰;入境健康检疫申明卡自动识别通关系统的研究[J];检验检疫科学;2004年03期
2 李莉;自动识别的新纪元[J];现代制造;2004年19期
3 赵岷;;中国自动识别产业进入快速发展期[J];信息与电脑;2005年02期
4 ;开创中国自动识别产业的新局面——中国自动识别技术协会第二届会员代表大会在北京召开[J];金卡工程;2005年03期
5 ;高效可靠的自动识别[J];现代制造;2005年03期
6 王艳春;李建军;何鹏;尹明;;公路交通管理中行驶车辆自动识别技术研究[J];微计算机信息;2006年02期
7 黄宇红;;运用自动识别技术提高烟草物流效益[J];物流科技;2006年03期
8 ;自动识别[J];金卡工程;2006年05期
9 矫云起;;创刊词[J];中国自动识别技术;2006年01期
10 王云争;王明磊;;自动识别技术在食品安全中的集成与应用综述[J];中国自动识别技术;2006年02期
相关会议论文 前10条
1 谢江;;自动识别技术在称重系统中的应用[A];首届全国称重技术研讨会论文集[C];1999年
2 邵金陵;何艳;赵荣椿;任金昌;;计算机对颅颌面影像的自动识别研究[A];第六届全国生物医学体视学学术会议暨第九届全军军事病理学学术会议、第五届全军定量病理学学术会议论文汇编[C];2005年
3 杨宇航;郑德权;于浩;赵铁军;;基于内容分析的作弊评论自动识别[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 买志玉;赵丹;昝红英;张坤丽;;基于例句语料库的现代汉语方位词用法自动识别研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 周丽娟;张坤丽;袁应成;昝红英;;基于规则的现代汉语连词用法自动识别研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 朱霞;陈俊斌;肖书成;黄永强;姚晓玲;;自动识别技术应用于军用物资包装标志的探讨[A];二十一世纪的中国包装——学术讨论会论文集[C];2000年
7 王玉岗;胡包钢;钟振民;庄顺万;;乐曲节拍的实时自动识别研究与系统开发[A];2001年中国智能自动化会议论文集(上册)[C];2001年
8 冯敏萱;;数量结构的自动识别方案[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 任柯昱;唐丹;尹显东;;特定图像内容的自动识别与过滤系统设计与实现[A];第二届全国信息与电子工程学术交流会暨第十三届四川省电子学会曙光分会学术年会论文集[C];2006年
10 韩裕生;王润生;;航片中丘陵田的自动识别研究[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
相关重要报纸文章 前9条
1 周文豪;让自动识别技术的作用更强劲[N];中国包装报;2012年
2 刘洪;认识自动识别技术[N];中国商报;2004年
3 本报记者 何立中;伍德兰:自动识别技术的先驱[N];中国计算机报;2012年
4 通讯员 姚蓓邋记者 秦宵喊;表格自动识别为出口退税提速[N];南京日报;2008年
5 记者 蔡成刚;人民出版社探索语义自动识别技术获得可喜成果[N];今日信息报;2010年
6 吴勇毅;物联网自动识别技术的发展趋势与市场机遇[N];中国冶金报;2010年
7 ;海关启用“电眼”[N];国际经贸消息;2000年
8 记者 周爱娟 实习记者 林玮 通讯员 任小斌;河南:自动识别车牌 有效遏制逃费[N];中国交通报;2010年
9 李广进;现场指纹输入计算机的新方法[N];人民公安报;2004年
相关博士学位论文 前4条
1 周芳;焦炭显微光学组织自动识别关键技术研究[D];合肥工业大学;2011年
2 刘德营;稻飞虱自动识别关键技术的研究[D];南京农业大学;2011年
3 辛动军;彩色地形图要素的自动识别与获取研究[D];南京理工大学;2007年
4 王朝莉;基于横截面图像分析的纤维异形度的指标表征和异形纤维种类的自动识别[D];东华大学;2012年
相关硕士学位论文 前10条
1 周溢辉;基于规则与统计的语气词用法自动识别研究[D];郑州大学;2011年
2 周丽娟;现代汉语连词用法的自动识别及应用研究[D];郑州大学;2012年
3 张腾飞;介词用法自动识别及其在信息抽取中的应用研究[D];郑州大学;2013年
4 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
5 高彩红;心电信号临床信息的自动识别研究[D];江苏大学;2010年
6 徐爱群;档案自动识别与存取技术研究及其自动档案库系统设计[D];浙江大学;2003年
7 杨学辉;基于自动识别并支持多人协同工作的预算系统模型[D];浙江大学;2003年
8 刘锐;基于规则的现代汉语副词用法自动识别研究[D];郑州大学;2009年
9 李茂兵;电成像测井自动识别和定量评价研究[D];中国石油大学;2010年
10 左航;测井曲线的自动识别与提取[D];四川大学;2003年
,本文编号:2007549
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2007549.html