基于本体的维吾尔语语义搜索引擎的研究与实现
本文关键词:基于本体的维吾尔语语义搜索引擎的研究与实现
更多相关文章: 维吾尔语本体 维吾尔语语义搜索引擎 语义扩展 维吾尔文在线处理
【摘要】:随着新疆经济的飞速发展,新疆少数民族语言网站建设也进入了新的发展阶段,其中,维吾尔文网站也形成了一定的规模,据有关部分2013年年底统计数据,新疆地区少数民族语言文字网站数超过几万,新疆上网用户突破1094万。所以,研究开发一个支持多语种的搜索引擎系统,为新疆的少数民族上网用户的本民族语言文字信息检索提供方便,开发多语种搜索引擎系统对少数民族地区教育和经济发展,提高本地区的信息化水平有着非常重要的意义。基于本体的智能化搜索引擎对互联网应用,互联网发展影响很大,通过智能化搜索引擎发现和累计有用信息,及时发现并去掉社会有害信息,对促进社会经济,文化,教育发展有很大的作用和积极的意义。基于本体的智能化搜索引擎的研究对新疆经济、文化、教育建设的高速稳定发展及网络不良信息的及时发现和消除具有非常重要的意义。但是维吾尔文字库编码标准化工作比较晚,维吾尔文网站建设起步比较晚等各种原因,到目前为止还没有一个针对维吾尔文网站的比较实用的搜索引擎系统。虽然出现了一些基于开源框架的搜索引擎网站系统,但这些搜索引擎系统信息检索能力较差,返回的搜索结果往往不尽人意,查全率和查准率上远远不能满足用户的需求,信息检索在用户关键字智能处理方面能力缺乏,用户寻往往寻找不到自己感兴趣的内容。这对维吾尔族网民在共享维吾尔文网络资源,网上检索信息带来了极大的不便,并影响了少数民族地区信息技术的发展。本文以维吾尔语的搜索引擎系统及其特点为研究课题,从维吾尔语语义本身的角度来研究语义搜索,建立维吾尔语搜索引擎搜索模型,重点分析基于维吾尔语的网络爬虫技术,维吾尔文编码处理技术,及基于本体维吾尔语信息检索技术,维吾尔文网页识别分析及维吾尔文在线处理技术,Android客户端维吾尔文显示技术等一些关键技术问题。
【关键词】:维吾尔语本体 维吾尔语语义搜索引擎 语义扩展 维吾尔文在线处理
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
- 摘要5-6
- ABSTRACT6-9
- 第一章 绪论9-15
- 1.1 课题研究目的和意义9-10
- 1.2 国内外研究现状10-11
- 1.3 主要研究内容11-13
- 1.4 全文主要内容及章节安排13-15
- 第二章 维吾尔语语义搜索引擎及其关键技术15-25
- 2.1 本体的基本概念,,目的及作用15-17
- 2.2 主流语义搜索引擎技术17-19
- 2.2.1 语义网与基于本体的语义搜索引擎17-18
- 2.2.2 语义网与专题搜索引擎框架18
- 2.2.3 语义专题爬虫概况18-19
- 2.3 基于本体的维吾尔语搜索引擎基本原理19-20
- 2.4 基于本体的维吾尔语搜索引擎关键技术20-24
- 2.4.1 基于语义词典的维吾尔文网页检测技术21-22
- 2.4.2 基于语义词典的维吾尔语分词和词干提取技术22-23
- 2.4.3 基于本体的维吾尔语语义搜索引擎中维吾尔文输入法技术23-24
- 2.5 本章总结24-25
- 第三章基于本体的维吾尔语语义搜索引擎需求分析25-29
- 3.1 基于本体的维吾尔语语义搜索引擎系统分析25-26
- 3.2 维吾尔语搜索引擎系统需求分析26-28
- 3.3 本章总结28-29
- 第四章 基于本体的维吾尔语语义搜索引擎总体设计29-40
- 4.1 系统设计目标29
- 4.2 搜索引擎系统概述及结构29-33
- 4.3 维吾尔语的主要特点33-35
- 4.4 基于本体的维吾尔语语义搜索引擎系统需求概述35-37
- 4.5 基于本体的维吾尔语语义搜索引擎总体设计37-39
- 4.6 本章总结39-40
- 第五章 维吾尔语搜索引擎系统详细设计40-53
- 5.1 基于本体的维吾尔语语义搜索引擎设计思想40
- 5.2 系统开发环境与开发工具40-44
- 5.3 基于本体的维吾尔语语义搜索引擎结构44-45
- 5.4 维吾尔语搜索引擎各模块详细设计45-52
- 5.4.1 网页搜集46-47
- 5.4.2 预处理47-49
- 5.4.3 查询服务49-51
- 5.4.4 维吾尔语语法分析模块的设计51-52
- 5.4.5 维吾尔文在线输入模块的设计52
- 5.5 本章总结52-53
- 第六章 维吾尔语搜索引擎系统实现53-64
- 6.1 搜索引擎网络爬虫的实现53-58
- 6.2 搜索引擎网页内容分析器的实现58-59
- 6.3 搜索引擎检索器和用户接.的实现59-62
- 6.4 基于本体的维吾尔语语义搜索引擎语义词典的实现62-63
- 6.5 本章总结63-64
- 第七章 维吾尔语搜索引擎系统测试64-68
- 7.1 系统测试及运行结果分析64-66
- 7.1.1 维吾尔语搜索引擎测试方法64-66
- 7.1.2 系统测试结果66
- 7.2 系统测试结果分析66-67
- 7.3 本章总结67-68
- 第八章 全文总结与展望68-70
- 致谢70-71
- 参考文献71-73
【共引文献】
中国期刊全文数据库 前10条
1 阮绪和;形名偏正结构的语法功能[J];安徽教育学院学报;2003年02期
2 张宜民;;语用视角下的征婚广告[J];安徽农业大学学报(社会科学版);2006年02期
3 许望;;语言:美感的凝聚——论语言在审美思维过程中的作用[J];安徽文学(下半月);2007年10期
4 马文彬;;浅谈网络词汇的规范[J];安徽文学(下半月);2009年08期
5 孙益欣;;从汉泰语言差异看对泰汉语教学[J];安徽文学(下半月);2011年01期
6 代颖颖;;关于学习和掌握舌尖前音和舌尖后音[J];安徽文学(下半月);2011年05期
7 马思周;;“语言规划”和“语文现代化”的三个含义[J];北华大学学报(社会科学版);2006年01期
8 慕金霞;;英语教学中的审美教育[J];边疆经济与文化;2006年12期
9 陈凌燕;;网络流行语“给力”探析[J];毕节学院学报;2011年05期
10 李向开;教师口语规范化初探[J];保山师专学报;2002年04期
中国重要会议论文全文数据库 前2条
1 陈玉珍;;英语学习词典的结构主义解读[A];福建省辞书学会第五届会员代表大会暨第十九届年会论文集[C];2009年
2 李燕芳;;中西思维差异在广告中的体现[A];福建省外国语文学会2008年年会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 潘世松;不同年龄段语用主体语体特征研究[D];复旦大学;2003年
2 聂蒲生;抗战时期在昆明专家对云南和大凉山的调查研究[D];华中师范大学;2004年
3 胡绪阳;语文德性论[D];湖南师范大学;2006年
4 杨洪建;哈萨克族学生汉语否定结构习得研究[D];新疆大学;2007年
5 吕明;法律意识形态的语义和意义[D];南京师范大学;2008年
6 闫从发;基于《汉语大词典》语料库的时代汉语词汇研究[D];山东大学;2009年
7 刘佳;多模态视角下的广告语言研究[D];山东大学;2013年
8 金双龙;东乡语研究[D];内蒙古大学;2013年
9 东主才让;藏族宗教与文字的产生和发展研究[D];中央民族大学;2013年
10 吴春生;《孙子兵法》疑难词句辨析[D];上海大学;2013年
中国硕士学位论文全文数据库 前10条
1 崔学勤;汉语字母词研究[D];安徽大学;2010年
2 项云莎;戴震《方言疏证》研究[D];山东师范大学;2011年
3 刘丽丹;现代汉语关联词语考察[D];华东师范大学;2011年
4 普萝塔索娃娜杰日达(Protasova Nadezhda);俄罗斯学生学习汉语过程中常见偏误分析与教学策略[D];辽宁师范大学;2011年
5 代媛;现代汉语词典编纂中的离合词问题[D];四川外语学院;2011年
6 张文林;犯罪隐语语汇研究[D];新疆师范大学;2010年
7 任会芹;成语辞典所收录的非四字条目研究[D];河北大学;2011年
8 曲春雪;武丁时期甲骨文双音词研究[D];河北大学;2011年
9 张小升;校园流行语与校园文化建设的互动[D];河北大学;2011年
10 党代莉;《毛诗正义》训诂术语研究[D];西北师范大学;2011年
本文编号:1102649
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1102649.html