当前位置:主页 > 科技论文 > 软件论文 >

基于词向量的藏文词性标注方法研究

发布时间:2018-05-13 18:02

  本文选题:词向量 + 藏文 ; 参考:《中文信息学报》2017年01期


【摘要】:藏文词性标注是藏文信息处理的基础,在藏文文本分类、自动检索、机器翻译等领域有广泛的应用。该文针对藏文语料匮乏,人工标注费时费力等问题,提出一种基于词向量模型的词性标注方法和相应算法,该方法首先利用词向量的语义近似计算功能,扩展标注词典;其次结合语义近似计算和标注词典,完成词性标注。实验结果表明,该方法能够快速有效地扩大了标注词典规模,并能取得较好的标注结果。
[Abstract]:Tibetan part of speech tagging is the basis of Tibetan information processing. It is widely used in Tibetan text classification, automatic retrieval, machine translation and so on. In view of the shortage of Tibetan corpus and the time-consuming and laborious manual annotation, this paper presents a new method and algorithm of word vector model based on word vector model. Firstly, this method uses the semantic approximate computing function of word vector to expand the tagging dictionary. Secondly, the part of speech tagging is completed by combining semantic approximate calculation and tagging dictionary. The experimental results show that the proposed method can quickly and effectively enlarge the scale of tagging dictionaries and obtain better annotation results.
【作者单位】: 西藏大学计算机科学与技术系;西南交通大学信息科学与技术学院;
【基金】:国家自然基金(61262058) 国家社会科学基金(15ZDB11) 西藏高校青年教师创新支持计划项目(QC2005_18) 高原学者计划—珠杰
【分类号】:TP391

【参考文献】

相关期刊论文 前6条

1 洛桑嘎登;赵小兵;;藏文词级处理研究现状及热点方法[J];电脑知识与技术;2015年32期

2 华却才让;刘群;赵海兴;;判别式藏语文本词性标注研究[J];中文信息学报;2014年02期

3 于洪志;李亚超;汪昆;冷本扎西;;融合音节特征的最大熵藏文词性标注研究[J];中文信息学报;2013年05期

4 扎西多杰;安见才让;;基于HMM藏文词性标注的研究与实现[J];计算机光盘软件与应用;2012年12期

5 扎西加;珠杰;;面向信息处理的藏文分词规范研究[J];中文信息学报;2009年04期

6 苏俊峰;祁坤钰;本太;;基于HMM的藏语语料库词性自动标注研究[J];西北民族大学学报(自然科学版);2009年01期

相关会议论文 前1条

1 才让加;吉太加;;藏语语料库中词性分类代码的确定[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

相关博士学位论文 前1条

1 康才uo;藏语分词与词性标注研究[D];上海师范大学;2014年

【共引文献】

相关期刊论文 前10条

1 艾金勇;;面向信息处理的藏文文本规范化方法研究[J];西北师范大学学报(自然科学版);2017年02期

2 陈小莹;;现代藏文中黏着语的规范化处理[J];电脑与信息技术;2017年01期

3 郑亚楠;珠杰;;基于词向量的藏文词性标注方法研究[J];中文信息学报;2017年01期

4 陈小莹;;藏文文本规范化处理研究[J];智能计算机与应用;2016年06期

5 陈小莹;;基于词典库的藏文黏着语规范化处理研究[J];西藏科技;2016年10期

6 江涛;于洪志;;一种面向藏文聚类的文本建模方法[J];西北民族大学学报(自然科学版);2016年03期

7 洛桑嘎登;赵小兵;;藏文词级处理研究现状及热点方法[J];电脑知识与技术;2015年32期

8 华却才让;赵海兴;;藏文屏幕取词和翻译关键技术研究[J];青海师范大学学报(自然科学版);2015年04期

9 李亚超;江静;加羊吉;于洪志;;TIP-LAS:一个开源的藏文分词词性标注系统[J];中文信息学报;2015年06期

10 高红梅;仁青诺布;普次仁;;领域本体的藏文主题爬虫搜索策略研究[J];计算机应用与软件;2015年09期

【二级参考文献】

相关期刊论文 前10条

1 于洪志;李亚超;汪昆;冷本扎西;;融合音节特征的最大熵藏文词性标注研究[J];中文信息学报;2013年05期

2 吴若南;;强化企业民主管理 推动转型跨越发展[J];江淮法治;2013年09期

3 缪中平;;加强国有企业民主管理的几点思考[J];现代营销(学苑版);2013年02期

4 刘超;;夯实企务公开民主管理为企业和谐发展创造环境[J];科学之友;2013年02期

5 扎西多杰;安见才让;;基于HMM藏文词性标注的研究与实现[J];计算机光盘软件与应用;2012年12期

6 巴桑杰布;羊毛卓玛;欧珠;;藏文分词系统中紧缩格识别和藏字复原的算法研究[J];西藏科技;2012年02期

7 张贯虹;斯·劳格劳;乌达巴拉;;融合形态特征的最大熵蒙古文词性标注模型[J];计算机研究与发展;2011年12期

8 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期

9 才智杰;;班智达藏文自动分词系统的设计与实现[J];青海师范大学民族师范学院学报;2010年02期

10 才智杰;才让卓玛;;班智达藏文标注词典设计[J];中文信息学报;2010年05期

【相似文献】

相关期刊论文 前10条

1 完么才让;安见才让;;藏语词性标注[J];信息与电脑(理论版);2013年08期

2 魏欧;孙玉芳;;汉语词性标注方法的研究[J];计算机科学;2000年07期

3 王素格,张永奎;基于搭配模式的汉语词性标注规则的获取方法[J];计算机工程与应用;2001年05期

4 杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期

5 刘健,郑家恒;基于实例的词性标注方法研究[J];山西气象;2001年02期

6 钱揖丽,郑家恒;汉语语料词性标注自动校对方法的研究[J];中文信息学报;2004年02期

7 张虎,郑家恒,刘江;语料库词性标注一致性检查方法研究[J];中文信息学报;2004年05期

8 吕琳,周世斌,刘玉树;一种高性能英文词性标注器的设计与实现[J];北京理工大学学报;2005年10期

9 牛洪梅;吐尔根;伊不拉音;;维吾尔语的词性标注校对初探[J];微型电脑应用;2006年12期

10 牛洪梅;加米拉·吾守尔;吐尔根·依布拉音;;现代维吾尔语的词性标注校对技术研究[J];伊犁师范学院学报(自然科学版);2007年01期

相关会议论文 前10条

1 刘娅琼;;论汉语语文辞书词性标注[A];中国辞书学会第六届中青年辞书工作者学术研讨会论文集[C];2010年

2 姜尚仆;陈群秀;;基于规则和统计的日语分词和词性标注的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

3 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年

4 李志江;;关于语文辞书词性标注的探讨[A];中国辞书学文集[C];1998年

5 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

6 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

7 苏祺;昝红英;胡景贺;项锟;;词性标注对信息检索系统性能的影响[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

8 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年

9 温锁林;;汉语词性自动标注软件兼类词鉴别规则库的设计[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年

10 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年

相关博士学位论文 前2条

1 康才uo;藏语分词与词性标注研究[D];上海师范大学;2014年

2 华却才让;基于树到串藏语机器翻译若干关键技术研究[D];陕西师范大学;2014年

相关硕士学位论文 前10条

1 刘慧敏;中文词性标注及未登录词词性预测研究[D];南京师范大学;2015年

2 刘海峰;基于web语科库的哈萨克语词法分析[D];中央民族大学;2015年

3 朱晓;古汉语编年体的人名实体识别与词性标注[D];复旦大学;2012年

4 赵嘉亿;中文词性标注中异构数据问题研究[D];复旦大学;2014年

5 米尔阿迪力江·麦麦提;基于Morfessor的维吾尔语词干提取和词性标注的研究[D];新疆大学;2015年

6 努尔曙阿克·阿斯哈尔;哈萨克语词性标注软件的开发[D];新疆大学;2015年

7 韩霞;基于半监督隐马尔科夫的汉语词性标注研究[D];大连理工大学;2015年

8 赵梓钧;“N+的+V”与相关的动名兼类分歧词考察[D];黑龙江大学;2015年

9 洛桑嘎登;藏文自动分词与词性标注研究[D];中央民族大学;2016年

10 杨蓓;老挝语分词和词性标注方法研究[D];昆明理工大学;2016年



本文编号:1884234

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1884234.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3959d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com