提高维吾尔文搜索质量的一些关键技术研究
本文关键词:提高维吾尔文搜索质量的一些关键技术研究
更多相关文章: 维吾尔语 搜索质量 词干提取 词缀附加 谷歌
【摘要】:维吾尔语和土耳其语、乌兹别克语、哈萨克语等同属于阿尔泰语系突厥语分支,是一种粘着型语言,具有丰富的构词合构形附加成分.主要分布于中国新疆维吾尔自治区,以及中西亚地区的维吾尔族使用.目前使用基于阿拉伯文字母的维吾尔文.当前用google,bing等搜索引擎搜索维吾尔文时搜索结果不包括该词语的构词合构形附加成分等其它形式.严重影响了搜索结果的准确性.通过词干提取和词缀附加生成词语组合的方法以解决提高维吾尔文搜索质量的问题.此问题解决,将在大幅度提高维吾尔文搜索的准确性,并针对提高其它突厥语族语言(土耳其语、乌兹别克语、哈萨克语等)的搜索质量、数据挖掘、数据分析、数据安全、自然语言理解等研究领域有一定的参考价值.
【作者单位】: 新疆大学
【关键词】: 维吾尔语 搜索质量 词干提取 词缀附加 谷歌
【基金】:自治区重点实验室开放课题 国家社科基金项目(11BXW038)
【分类号】:TP391.1
【正文快照】: 1引言维吾尔语和土耳其语、乌兹别克语、哈萨克语等同属于阿尔泰语系突厥语分支,,是一种粘着型语言111,具有丰富的构词合构形附加成分.主要分布于中国新疆维吾尔自治区(面积165万平方公里),以及中西亚地区的维吾尔族使用.目前使用基于阿拉伯文字母的维吾尔文.使用人口约有10
【参考文献】
中国期刊全文数据库 前3条
1 阿依克孜·卡德尔;开沙尔·卡德尔;吐尔根·依布拉音;;面向自然语言信息处理的维吾尔语名词形态分析研究[J];中文信息学报;2006年03期
2 早克热·卡德尔;艾山·吾买尔;吐尔根·依布拉音;艾斯卡尔·艾木都拉;;维吾尔语名词构形词缀有限状态自动机的构造[J];中文信息学报;2009年06期
3 海丽且木·艾沙;维尼拉·木沙江;;维、哈、柯多文种搜索引擎中web文本分类的研究[J];新疆大学学报(自然科学版);2011年03期
【共引文献】
中国期刊全文数据库 前10条
1 早克热·卡德尔;吐尔根·依布拉音;;维吾尔语形容词构形词缀有限状态自动机[J];电脑知识与技术;2009年04期
2 黄千;陈笑蓉;倪利华;;水书字音编码研究[J];贵州大学学报(自然科学版);2011年04期
3 艾山·吾买尔;吐尔根·依步拉音;早克热·卡德尔;;基于噪声信道的维吾尔语央音原音识别模型[J];计算机工程与应用;2010年15期
4 徐春;杨勇;董兴华;;汉维/维汉统计机器翻译中若干问题研究[J];计算机工程与应用;2011年35期
5 阿力木江·艾沙;吐尔根·依布拉音;艾山·吾买尔;马尔哈巴·艾力;;基于机器学习的维吾尔文文本分类研究[J];计算机工程与应用;2012年05期
6 阿孜古丽·夏力甫;;维吾尔语动词附加语素的复杂特征研究[J];中文信息学报;2008年03期
7 早克热·卡德尔;艾山·吾买尔;吐尔根·依布拉音;艾斯卡尔·艾木都拉;;维吾尔语名词构形词缀有限状态自动机的构造[J];中文信息学报;2009年06期
8 吐尔根·依布拉音;袁保社;;新疆少数民族语言文字信息处理研究与应用[J];中文信息学报;2011年06期
9 麦热哈巴·艾力;姜文斌;吐尔根·依布拉音;;维吾尔语词法中音变现象的自动还原模型[J];中文信息学报;2012年01期
10 阿孜古丽·夏力甫;早克热·卡德尔;吐尔根·依布拉音;;维吾尔语动词体范畴的有限状态自动机的构建[J];中文信息学报;2012年04期
中国重要会议论文全文数据库 前5条
1 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 艾山·吾买尔;吐尔根·依不拉音;早克热·卡德尔;;维吾尔语名词词干提取算法的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 艾山·吾买尔;吐尔根·依不拉音;早克热·卡德尔;;基于噪声信道模型的维吾尔语央音原音识别[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 李文;李淼;张建;陈雷;雪艳;;一种带权值参数的非监督式形态切分方法[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 早克热·卡德尔;艾山·吾买尔;吐尔根·依布拉音;帕里旦·吐尔逊;买热哈巴·艾力;;基于混合策略的维吾尔语名词词干提取系统[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国硕士学位论文全文数据库 前4条
1 冯玉花;维吾尔文本驱动的基于VRML虚拟人手语库的构建[D];新疆大学;2011年
2 刘源;基于词干特征的维吾尔语文本聚类研究与实现[D];新疆大学;2012年
3 玛依努尔·沙地克;面向自然语言信息处理的维吾尔语动词形态分析研究[D];新疆大学;2012年
4 卡哈尔江·阿比的热西提;基于实例的汉维—维汉双向机器翻译系统的研究[D];上海交通大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 宋玲;马军;连莉;张志军;;文档相似度综合计算研究[J];计算机工程与应用;2006年30期
2 高洁,吉根林;文本分类技术研究[J];计算机应用研究;2004年07期
3 牛强;王志晓;陈岱;夏士雄;;基于KNN的Web文本分类方法的研究[J];计算机应用与软件;2007年10期
4 白锡嘉;机器翻译与自然语言的理解[J];中国科技翻译;1996年02期
5 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期
6 古丽拉·阿东别克,米吉提·阿布力米提;维吾尔语词切分方法初探[J];中文信息学报;2004年06期
7 阿依克孜·卡德尔;开沙尔·卡德尔;吐尔根·依布拉音;;面向自然语言信息处理的维吾尔语名词形态分析研究[J];中文信息学报;2006年03期
8 米热古丽·艾力;米吉提·阿不力米提;艾斯卡尔·艾木都拉;;基于词法分析的维吾尔语元音弱化算法研究[J];中文信息学报;2008年04期
9 张晓龙,姚天顺;基于文本句法的文本生成模型[J];中文信息学报;1995年01期
10 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
中国硕士学位论文全文数据库 前1条
1 缪成;基于红旗Linux的维、汉、英多语种操作系统的设计与实现[D];新疆大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 冯冠军;禹龙;田生伟;;基于CRFs自动构建维吾尔语情感词语料库[J];现代图书情报技术;2011年03期
2 古丽拉·阿东别克,米吉提·阿布力米提;维吾尔语词切分方法初探[J];中文信息学报;2004年06期
3 米尔夏提·力提甫;古丽巴哈尔·买买提;维尼拉·木沙江;木合塔尔·买合苏提;;日-维机械翻译系统中格助词的研究[J];新疆大学学报(自然科学版);2008年01期
4 扎依达·木沙;吐尔根·依布拉音;;基于规则的维吾尔语对偶词识别算法研究[J];新疆大学学报(自然科学版);2009年02期
5 玉素甫·艾白都拉;阿不都热依木·沙力;阿拉帕提古丽;;信息处理用维语词汇标注标记集的确定[J];计算机应用;2009年07期
6 禹龙;田生伟;冯冠军;;维吾尔语情感词汇自动识别[J];计算机工程;2011年07期
7 玉素甫·艾白都拉;张海军;艾孜尔古丽;;信息处理用现代维吾尔语词干词类标记集研究[J];信息技术与标准化;2011年06期
8 马欢;吾守尔·斯拉木;;维吾尔语文语转换系统文本分析模块初探[J];计算机工程;2006年16期
9 依明·苏来曼;;浅析Moodle在新疆本地化过程中存在的问题[J];中国教育信息化;2008年20期
10 阿里甫·库尔班;吾买尔江·库尔班;吐尔根·伊布拉音;;信息处理维吾尔语词语分类体系及标记研究(Ⅰ)[J];新疆大学学报(自然科学版);2009年04期
中国重要会议论文全文数据库 前10条
1 艾山·吾买尔;吐尔根·依不拉音;早克热·卡德尔;;维吾尔语名词词干提取算法的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 王昆仑;樊志锦;吐尔洪江;方晓华;徐绍琼;吾买尔;;维吾尔语综合语音数据库系统[A];第五届全国人机语音通讯学术会议论文集[C];1998年
3 古丽拉.阿东别克;达吾勒.阿布都哈依尔;;基于规则的哈萨克语词干提取系统的研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 玉素甫.艾白都拉;阿不都热依木.沙力;木沙江;;面向现代维吾尔语处理的短语信息库构造方法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 阿比达.吾买尔;吐尔根.依布拉音;;维吾尔文音节切分方法的研究与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 阿力甫·库尔班;阿力木江·托乎提;吐尔根·依布拉音;;维吾尔语单句句法分析研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 吾守尔·斯拉木;;维汉声图文一体化信息处理环境及应用系统[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
9 吾守尔.斯拉木;马欢;;维吾尔语文语转换系统的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 库尔班·吾布力;艾斯卡尔·艾木都拉;;基于量化模型的维吾尔语调曲线F_0的合成技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国重要报纸全文数据库 前5条
1 新自疆;新疆教学多平台 学用出效益[N];农民日报;2007年
2 瀛寰;少数民族应用:增值服务新蓝海[N];中国计算机报;2006年
3 王慧敏;新疆远程教育让边民致富不再“遥远”[N];人民日报;2007年
4 蒋夫尔;新疆远程教育覆盖九成农村校[N];中国教育报;2008年
5 本报记者 丁全利;让地理信息离公众更近些[N];中国国土资源报;2008年
中国硕士学位论文全文数据库 前10条
1 陈鹏;基于语料库的维吾尔语词干提取和词性标注[D];新疆大学;2006年
2 赵倩倩;维吾尔语信息检索[D];天津大学;2012年
3 吴小川;泛化的基于实例方法的汉语维吾尔语模板库的构建[D];新疆大学;2012年
4 刘源;基于词干特征的维吾尔语文本聚类研究与实现[D];新疆大学;2012年
5 卡哈尔江·阿比的热西提;基于实例的汉维—维汉双向机器翻译系统的研究[D];上海交通大学;2012年
6 米吉提·阿布力米提;维吾尔语文字校对系统[D];新疆大学;2001年
7 闫继钢;搜索引擎的研究与实现[D];兰州大学;2009年
8 马欢;基于不定长拼接单元的维吾尔语文语转换系统的研究与实现[D];新疆大学;2006年
9 贺慧;基于主动学习SVM的蒙文文本分类系统的设计与实现[D];内蒙古大学;2006年
10 李莉;维语文语转换系统的研究与实现[D];新疆大学;2004年
本文编号:1085354
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1085354.html