基于词词关联矩阵改进的模糊检索研究
发布时间:2022-09-30 21:23
基于词词关联矩阵的模糊检索算法通过词词关联矩阵构建算法运行的环境。在算法实践过程中,尤其是用该算法去改进已有的标准布尔检索系统,原有系统效率往往会下降,主要原因集中在两个方面:(1)词词关联矩阵的构造需要大量的数据支撑和长的处理时间(2)词词关联矩阵属于自构造词表,词间关系单一,存在误相关和假相关情形。基于上述问题,本文从词词关联矩阵改进的角度出发,采取多种措施来解决问题。 第2部分,通过模糊集合检索模型的规范描述,本节首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布尔检索系统的性能,指出模糊集合检索系统所面临的“囚徒困境”:检索效率的提升引起了系统效率的下降。之后针对“囚徒困境”,从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决“囚徒困境”的思路和技术手段。最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式。根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢。 第3部分,传统上...
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 引言
1.1 研究背景
1.2 研究内容及思路
1.3 研究现状
1.3.1 国外研究现状
1.3.2 国内研究现状
1.4 研究方法及条件
1.5 研究意义
2 词词关联矩阵构造的策略及时机选择
2.1 “囚徒困境”下的模糊集合检索系统
2.1.1 系统效率与检索效率函数关系
2.1.2 现有模糊集合检索系统性能分析与评价
2.2 解决思路和技术环境
2.3 词词关联矩阵的构造策略
2.3.1 静态存储策略
2.3.2 静态存储策略实例展示及性能分析
2.3.3 动态缓存策略
2.3.4 动态缓存策略实例展示及性能分析
2.4 词词关联矩阵构造的时机选择
3 叙词表控制下词间关联度的改进算法
3.1 现有算法问题
3.2 改进算法设计
3.2.1 系统词表选择
3.2.2 改进算法设计过程
3.2.3 词表控制机制设计
3.3 改进算法与现有算法比较研究
3.3.1 集合分析
3.3.2 语词关系网实证分析
4 模糊语词转模糊概念检索方法探究
4.1 本体与叙词表比较研究
4.2 相关研究
4.2.1 直接转换法
4.2.2 间接转换法
4.3 综合转换法
4.3.1 同义词合并
4.3.2 核心概念抽取
4.3.3 概念间结构联系设计
4.3.4 词间关联度调整
4.3.5 本体设计
4.4 检索过程调整
5 总结与展望
参考文献
攻读学位期间的研究工作
致谢
【参考文献】:
期刊论文
[1]关于范式求法解析[J]. 吴双权. 科技创新导报. 2012(36)
[2]基于语义资源的生物医学文献知识发现[J]. 周峰,林鸿飞,杨志豪. 情报学报. 2012 (03)
[3]基于BootStrapping的中文事件元素抽取系统设计与实现[J]. 赵江江,秦兵. 智能计算机与应用. 2012(01)
[4]叙词表无关联词分析与处理[J]. 常春,王星. 情报杂志. 2011(08)
[5]基于关键词分析的叙词表词间等同关系探讨[J]. 杨慧,曹锦丹. 图书馆工作与研究. 2011(08)
[6]基于叙词表的知识单元检索系统设计[J]. 熊霞,常春. 图书情报工作. 2010(12)
[7]论叙词表的概念属性对本体理论的渗透与转换[J]. 陈立华. 图书情报工作. 2010(12)
[8]CSSCI数据导入Bibexcel实现共现矩阵的方法及实证研究[J]. 姜春林,陈玉光. 图书馆杂志. 2010(04)
[9]基于模糊集的信息检索方法[J]. 汪小珍,李龙澍. 计算机技术与发展. 2010(02)
[10]高访问量信息平台响应性能优化研究与实现[J]. 谢瑞莲,耿国华,周明全,杨波. 计算机应用研究. 2009(07)
硕士论文
[1]构造领域本体概念关系的自动抽取[D]. 陈珂.上海交通大学 2008
本文编号:3684298
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 引言
1.1 研究背景
1.2 研究内容及思路
1.3 研究现状
1.3.1 国外研究现状
1.3.2 国内研究现状
1.4 研究方法及条件
1.5 研究意义
2 词词关联矩阵构造的策略及时机选择
2.1 “囚徒困境”下的模糊集合检索系统
2.1.1 系统效率与检索效率函数关系
2.1.2 现有模糊集合检索系统性能分析与评价
2.2 解决思路和技术环境
2.3 词词关联矩阵的构造策略
2.3.1 静态存储策略
2.3.2 静态存储策略实例展示及性能分析
2.3.3 动态缓存策略
2.3.4 动态缓存策略实例展示及性能分析
2.4 词词关联矩阵构造的时机选择
3 叙词表控制下词间关联度的改进算法
3.1 现有算法问题
3.2 改进算法设计
3.2.1 系统词表选择
3.2.2 改进算法设计过程
3.2.3 词表控制机制设计
3.3 改进算法与现有算法比较研究
3.3.1 集合分析
3.3.2 语词关系网实证分析
4 模糊语词转模糊概念检索方法探究
4.1 本体与叙词表比较研究
4.2 相关研究
4.2.1 直接转换法
4.2.2 间接转换法
4.3 综合转换法
4.3.1 同义词合并
4.3.2 核心概念抽取
4.3.3 概念间结构联系设计
4.3.4 词间关联度调整
4.3.5 本体设计
4.4 检索过程调整
5 总结与展望
参考文献
攻读学位期间的研究工作
致谢
【参考文献】:
期刊论文
[1]关于范式求法解析[J]. 吴双权. 科技创新导报. 2012(36)
[2]基于语义资源的生物医学文献知识发现[J]. 周峰,林鸿飞,杨志豪. 情报学报. 2012 (03)
[3]基于BootStrapping的中文事件元素抽取系统设计与实现[J]. 赵江江,秦兵. 智能计算机与应用. 2012(01)
[4]叙词表无关联词分析与处理[J]. 常春,王星. 情报杂志. 2011(08)
[5]基于关键词分析的叙词表词间等同关系探讨[J]. 杨慧,曹锦丹. 图书馆工作与研究. 2011(08)
[6]基于叙词表的知识单元检索系统设计[J]. 熊霞,常春. 图书情报工作. 2010(12)
[7]论叙词表的概念属性对本体理论的渗透与转换[J]. 陈立华. 图书情报工作. 2010(12)
[8]CSSCI数据导入Bibexcel实现共现矩阵的方法及实证研究[J]. 姜春林,陈玉光. 图书馆杂志. 2010(04)
[9]基于模糊集的信息检索方法[J]. 汪小珍,李龙澍. 计算机技术与发展. 2010(02)
[10]高访问量信息平台响应性能优化研究与实现[J]. 谢瑞莲,耿国华,周明全,杨波. 计算机应用研究. 2009(07)
硕士论文
[1]构造领域本体概念关系的自动抽取[D]. 陈珂.上海交通大学 2008
本文编号:3684298
本文链接:https://www.wllwen.com/tushudanganlunwen/3684298.html