当前位置:主页 > 社科论文 > 图书档案论文 >

基于本体的语义索引策略研究

发布时间:2021-06-22 13:34
  随着Internet的迅猛发展,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大的动态信息服务网站,为用户提供了一个极具价值的信息源。而传统的信息检索技术由于对这些信息的语义理解有限,越来越不能满足用户的检索需求。语义检索作为一种基于语义理解的信息检索方法,已成为信息检索研究的重点。本体作为解决语义层次上Web信息共享和交换的基础,语义检索对其具有很强的依赖性。目前对基于本体的语义检索研究,未考虑本体中没有可用的知识对系统检索性能的影响。在本体的利用上,没能充分利用本体中的概念关系,影响了对文档语义理解的准确性。针对以上的这些问题,本论文结合了传统的关键字索引和语义索引方法,在概念一文档权重的基础上对本体概念的部分关系权重进行扩展,提出一种基于本体的语义索引策略。本文的主要内容是:第一章绪论,简单介绍了本文的选题背景及意义,总结了语义检索的研究现状,分析了其存在的问题,说明了本文的研究内容和组织结构。第二章是相关知识概述。本章分为四部分,第一节从信息检索的发展、信息检索的基本定义、信息检索的分类、信息检索模型的分类这四方面对信息检索进行概述。第二节介绍了语义网的结构以及本体的概念... 

【文章来源】:曲阜师范大学山东省

【文章页数】:46 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
目录
1 绪论
    1.1 选题背景和意义
        1.1.1 选题背景
        1.1.2 选题意义
    1.2 相关研究现状
    1.3 论文的研究方法
    1.4 论文组织结构
    1.5 论文创新点
2 相关知识概述
    2.1 信息检索概述
        2.1.1 信息检索的发展
        2.1.2 信息检索的基本定义
        2.1.3 信息检索的分类
        2.1.4 信息检索模型的分类
    2.2 语义网和本体的概述
        2.2.1 语义网
        2.2.2 本体的概念
        2.2.3 本体的分类
        2.2.4 本体的功能
        2.2.5 OWL介绍
        2.2.6 本体构建工具
    2.3 索引
        2.3.1 索引的概念
        2.3.2 索引的特点
        2.3.3 索引的优点
        2.3.4 索引的缺点
        2.3.5 索引分类
    2.4 语义索引
3 C++课程本体的语义索引策略研究
    3.1 C++课程本体的语义索引的设计思路
    3.2 C++课程本体的建立
    3.3 向量空间模型
    3.4 语义信息的处理
        3.4.1 信息的预处理
        3.4.2 分词
            3.4.2.1 分词技术的难点
            3.4.2.2 分词算法分类
        3.4.3 关键词提取
    3.5 权值的计算方法
        3.5.1 布尔权重
        3.5.2 特征频度
        3.5.3 TF-IDF权重
    3.6 基于本体的语义索引策略研究
        3.6.1 概念一文档权重
        3.6.2 语义关系权重
        3.6.3 基于概念一文档的部分语义关系扩展权重
4 实验测试
    4.1 实验工具
        4.1.1 实验平台和工具
        4.1.2 分词与关键词处理工具ICTCLAS
        4.1.3 索引工具Lucene
    4.2 实验
        4.2.1 分词和词性标注
        4.2.2 关键词提取
        4.2.3 实验数据
        4.2.4 索引的建立
5 总结与展望
    5.1 本文工作总结
    5.2 展望
参考文献
攻读硕士学位期间发表的论文
参与科研项目
致谢


【参考文献】:
期刊论文
[1]基于潜在语义索引的特征选择与权重改进若干关键问题的研究与实现[J]. 李媛媛,马永强.  现代图书情报技术. 2007(10)
[2]本体在数字图书馆信息检索中的应用研究[J]. 陈太洋,王发社.  图书馆学研究. 2007(07)
[3]基于语义索引词的语义网信息检索模型[J]. 虞为,曹加恒,曾承,黄敏,陈俊鹏.  计算机工程. 2007(03)
[4]语义对等网中资源元数据混合索引策略研究[J]. 刘震,邓苏,罗雪山,黄宏斌.  国防科技大学学报. 2006(06)
[5]基于统计的句法分析方法研究[J]. 王继曾,任浩征,罗恒,刘宽.  计算机工程与设计. 2006(12)
[6]基于多本体语义相似度计算的对等网资源动态匹配方法研究[J]. 刘震,邓苏,罗雪山,黄宏斌.  计算机科学. 2006(03)
[7]中文信息处理中自动分词技术的研究与展望[J]. 刘迁,贾惠波.  计算机工程与应用. 2006(03)
[8]基于K-Means的文本层次聚类算法研究[J]. 尉景辉,何丕廉,孙越恒.  计算机应用. 2005(10)
[9]基于本体论的论文检索[J]. 朱庆生,邹景华.  计算机科学. 2005(05)

博士论文
[1]基于潜在语义分析的中文概念检索研究[D]. 刘云峰.华中科技大学 2005
[2]基于统计的文本分类技术研究[D]. 程军.中国科学院研究生院(文献情报中心) 2003

硕士论文
[1]基于领域本体信息检索的研究及其实现[D]. 刘树林.东北师范大学 2009
[2]中文信息处理中若干技术的研究与实现[D]. 罗丽俊.辽宁科技大学 2008
[3]基于潜在语义索引的中文文本检索研究[D]. 李媛媛.西南交通大学 2008
[4]基于本体的语义检索技术研究[D]. 郑任儿.华东师范大学 2007
[5]中文索引策略的研究[D]. 韩中元.哈尔滨工程大学 2007
[6]基于潜在语义索引的文本分类技术的研究[D]. 全德.东北大学 2005
[7]潜在语义索引在中文文本聚类中的应用研究[D]. 马国俊.西安建筑科技大学 2004



本文编号:3242928

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3242928.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户20580***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com