Web信息服务中受控语言研究
发布时间:2021-11-18 04:00
Web信息服务采用知识组织体系和规范操作流程构建基于主题的有序信息空间。受控语言是链接因特网信息空间、人类精神世界和现实物质世界的符号化概念标识系统。受控语言针对Web信息内容的主题特征来建立信息链接,通过“用、代、属、分、参”等规范形式标识信息实体间关系特征,成为用户使用因特网信息的浏览工具和检索净化装置。用户在发现、定位、检索、获取信息的各个环节中使用分类法和主题词表改变知识视野。检索语言的选择和概念关系的导引使用户知识视野依次深入。 Web信息服务中受控语言的应用可以分为功能层和技术层,每个层次的应用需要遵循各自的标准。受控语言的功能是浏览和检索。其中分类法用于构建浏览结构,根据信息服务范围和类型使用通用分类法和专题分类法。分类法的层次和类目需简化。主题词表可改善检索的效率,在信息发现中过滤信息。在集成多个Web信息服务系统过程中,受控语言扩展数据结构和通信协议以实现交叉浏览和交叉检索。后控词表可改善用户检索的查全率。在合理性能价格比的前提下,受控语言的语义表达比自然语言明确和一致。 受控语言作为因特网上的数字对象,是因特网信息资源自我描述的词汇。它的技术架构可分为数...
【文章来源】:中国科学院大学(中国科学院文献情报中心)北京市
【文章页数】:172 页
【学位级别】:博士
【文章目录】:
目录
图目录
表目录
1 引言
1.1 研究背景
1.2 研究方法
1.3 研究目的
1.3.1 Web信息系统中的受控语言
1.3.2 应用受控语言的技术框架
1.3.3 用户使用信息为中心
1.4 论文结构
2 受控语言研究现状和应用需求
2.1 WEB信息服务和受控语言
2.1.1 Web信息服务概述
2.1.2 受控语言概述
2.2 国外受控语言研究综述
2.2.1 研究主题框架
2.2.2 受控语言的项目进展
2.2.2.1 OCLC的Scorpion和DDC研究项目
2.2.2.2 美国国会图书馆Classification Web
2.2.2.3 欧盟的DESIRE学科信息门户项目
2.2.2.4 IFLA书目控制功能规范
2.2.2.5 MODEL术语工作组研究项目
2.2.2.6 NKOS电子叙词表研究
2.2.3 受控语言研究热点
2.2.3.1 标准化
2.2.3.2 互操作性
2.2.3.3 自动化处理
2.3 国内受控语言研究综述
2.3.1 受控语言研究主题
2.3.2 受控语言研究进展
2.3.2.1 词表和分类法的编制
2.3.2.2 标准化和兼容化
2.3.2.3 机读词表和分类法
2.3.3 与国外研究水平的差距
2.4 受控语言的应用需求
2.4.1 宏观需求
2.4.1.1 CNNIC的调查报告
2.4.1.2 赛迪网搜索引擎调查报告
2.4.1.3 HILT调查报告
2.4.2 微观需求
3 受控语言的功能结构
3.1 分类浏览信息资源
3.1.1 分类浏览的优缺点
3.1.2 分类法的种类
3.1.2.1 分类法基本类型
3.1.2.2 通用分类法
3.1.2.3 国家分类法
3.1.2.4 学科分类法
3.1.2.5 自制分类法
3.1.3 分类法的应用
3.1.3.1 DDC杜威十进制分类法
3.1.3.2 UDC国际十进制分类法
3.1.3.3 LCC国会图书分类法
3.1.3.4 中国图书馆图书分类法
3.1.3.5 分类浏览结构建设原则
3.1.3.6 研究信息的分类浏览
3.1.3.7 手工建立分类浏览结构
3.1.3.8 自动生成分类浏览结构
3.2 叙词表改善检索效率
3.2.1 叙词语言概述
3.2.1.1 叙词概念辨析
3.2.1.2 国内外主题词表发展历史
3.2.1.3 叙词表的作用
3.2.2 叙词表的应用
3.2.2.1 MeSH的UMLS
3.2.2.2 搜索引擎用Wordnet关键词表
3.2.2.3 Keyword AAA电子档案主题词表
3.3 互操作
3.3.1 互操作定义
3.3.2 交叉浏览
3.3.3 交叉检索
3.4 信息检索中的受控语言
3.4.1 信息检索的认知过程
3.4.2 后控词表
3.4.3 自然语言检索
4 受控语言的应用技术框架
4.1 总体技术框架
4.1.1 框架层次
4.1.2 应用模式
4.1.2.1 紧密型
4.1.2.2 松散型
4.2 数据结构
4.2.1 分类法结构
4.2.1.1 ISO2709
4.2.1.2 MARC 21
4.2.1.3 UNIMARC
4.2.1.4 CNMARC
4.2.2 叙词表结构
4.1.2.1 MARC 21
4.1.2.2 Zthes Profile
4.2.3 XML
4.2.4 元数据
4.2.5 RDF
4.2.6 受控语言数据结构评述
4.3 通信协议
4.3.1 Z39.50协议
4.3.1.1 Z39.50概述
4.3.1.2 Z39.50应用大纲
4.3.1.3 Bath应用大纲
4.3.1.4 Z39.50/Web网关
4.3.1.5 Z39.50优缺点
4.3.1.6 Z39.50应用评价
4.3.2 HTTP协议
4.3.2.1 HTTP概述
4.3.2.2 网络数据库模式
4.3.2.3 HTTP的优缺点
4.3.2.4 HTTP协议的扩展
4.3.3 WHOIS++协议
4.3.4 OAI信息获取协议
4.3.5 受控语言通信协议评述
4.4 应用系统集成
4.4.1 参考文献链接
4.4.2 Web Service
4.4.3 受控语言元数据登记系统
4.4.4 专业应用系统
4.4.4.1 自动分类
4.4.4.2 全文检索系统
4.4.4.3 电子词典
4.4.4.4 电子书
4.4.4.5 个性化信息服务
4.4.4.6 受控语言的可视化
4.4.5 受控语言应用集成评述
5 受控语言应用试验
5.1 试验背景
5.2 目标
5.3 方法
5.4 过程
5.4.1 试验准备
5.4.1.1 硬件和网络环境
5.4.1.2 软件
5.4.1.3 试验数据
5.4.2 试验过程
5.4.2.1 ROADS的安装和调试
5.4.2.2 INDEXDATA的Z39.50软件包
5.4.2.3 丹诚公司的Z39.50客户端软件
5.4.2.4 导入试验数据
5.4.2.5 平台功能概述
5.4.3 试验框架
5.4.4 试验点
5.4.4.1 分类浏览
5.4.4.2 词表管理
5.4.4.3 检索中词表支持
5.4.4.4 Z39.50检索
5.4.4.5 Zthes Profile
5.4.4.6 都柏林核心集
5.4.4.7 交叉检索
5.5 结果
5.5.1 分类浏览结构
5.5.2 检索的查全率
5.5.3 HTTP/Z39.50/WHOIS++的兼容性
5.5.4 标准格式转换输出
5.5.5 对国内学科信息门户的建议
5.6 评价
5.6.1 集成性
5.6.2 扩展性
5.6.3 安全性
5.6.4 易用性
5.7 进一步试验
5.7.1 MARC格式的受控词表支持
5.7.2 互操作性试验
5.7.3 受控语言在信息获取和处理中的应用
5.8 试验总结
6 结论
7 附件
附件1 术语表
附件2 受控语言研究机构和项目
附件3 受控语言研究站点
附件4 XML叙词表
附件5 ZTHES PROFILE叙词
附件6 DOCUMENT和DC的字段对照表
附件7 DUBLINCORE模板的基本结构
8 主题索引
9 参考引用文献
10 发表文章和致谢
【参考文献】:
期刊论文
[1]开放数字环境下的参考文献链接[J]. 张晓林. 现代图书情报技术. 2002(01)
[2]网络专业指引库的构建理论及实现技术探讨[J]. 张雪英. 现代图书情报技术. 2000(06)
[3]90年代我国主题检索词表编制理论研究述评[J]. 朱蓓. 图书情报知识. 1999(02)
[4]试论一体化医学语言系统(UMLS)超级叙词表的特点[J]. 方平. 图书情报工作. 1998(10)
[5]联网环境中的情报检索语言研究[J]. 赵英莉. 图书情报工作. 1998(05)
[6]文献题名自动抽词——分类标引系统[J]. 张琪玉. 图书馆杂志. 1998(04)
[7]叙词表的分面化改造[J]. 张琪玉. 图书馆论坛. 1997(06)
[8]DDC:21世纪知识组织的工具[J]. 柴纯青. 图书馆. 1997(05)
[9]学科-事物概念组配型检索语言——关于情报检索语言的遐想与求索[J]. 张琪玉. 图书馆杂志. 1997(02)
[10]中外叙词表的发展[J]. 宋翠云. 河南图书馆学刊. 1995(04)
本文编号:3502161
【文章来源】:中国科学院大学(中国科学院文献情报中心)北京市
【文章页数】:172 页
【学位级别】:博士
【文章目录】:
目录
图目录
表目录
1 引言
1.1 研究背景
1.2 研究方法
1.3 研究目的
1.3.1 Web信息系统中的受控语言
1.3.2 应用受控语言的技术框架
1.3.3 用户使用信息为中心
1.4 论文结构
2 受控语言研究现状和应用需求
2.1 WEB信息服务和受控语言
2.1.1 Web信息服务概述
2.1.2 受控语言概述
2.2 国外受控语言研究综述
2.2.1 研究主题框架
2.2.2 受控语言的项目进展
2.2.2.1 OCLC的Scorpion和DDC研究项目
2.2.2.2 美国国会图书馆Classification Web
2.2.2.3 欧盟的DESIRE学科信息门户项目
2.2.2.4 IFLA书目控制功能规范
2.2.2.5 MODEL术语工作组研究项目
2.2.2.6 NKOS电子叙词表研究
2.2.3 受控语言研究热点
2.2.3.1 标准化
2.2.3.2 互操作性
2.2.3.3 自动化处理
2.3 国内受控语言研究综述
2.3.1 受控语言研究主题
2.3.2 受控语言研究进展
2.3.2.1 词表和分类法的编制
2.3.2.2 标准化和兼容化
2.3.2.3 机读词表和分类法
2.3.3 与国外研究水平的差距
2.4 受控语言的应用需求
2.4.1 宏观需求
2.4.1.1 CNNIC的调查报告
2.4.1.2 赛迪网搜索引擎调查报告
2.4.1.3 HILT调查报告
2.4.2 微观需求
3 受控语言的功能结构
3.1 分类浏览信息资源
3.1.1 分类浏览的优缺点
3.1.2 分类法的种类
3.1.2.1 分类法基本类型
3.1.2.2 通用分类法
3.1.2.3 国家分类法
3.1.2.4 学科分类法
3.1.2.5 自制分类法
3.1.3 分类法的应用
3.1.3.1 DDC杜威十进制分类法
3.1.3.2 UDC国际十进制分类法
3.1.3.3 LCC国会图书分类法
3.1.3.4 中国图书馆图书分类法
3.1.3.5 分类浏览结构建设原则
3.1.3.6 研究信息的分类浏览
3.1.3.7 手工建立分类浏览结构
3.1.3.8 自动生成分类浏览结构
3.2 叙词表改善检索效率
3.2.1 叙词语言概述
3.2.1.1 叙词概念辨析
3.2.1.2 国内外主题词表发展历史
3.2.1.3 叙词表的作用
3.2.2 叙词表的应用
3.2.2.1 MeSH的UMLS
3.2.2.2 搜索引擎用Wordnet关键词表
3.2.2.3 Keyword AAA电子档案主题词表
3.3 互操作
3.3.1 互操作定义
3.3.2 交叉浏览
3.3.3 交叉检索
3.4 信息检索中的受控语言
3.4.1 信息检索的认知过程
3.4.2 后控词表
3.4.3 自然语言检索
4 受控语言的应用技术框架
4.1 总体技术框架
4.1.1 框架层次
4.1.2 应用模式
4.1.2.1 紧密型
4.1.2.2 松散型
4.2 数据结构
4.2.1 分类法结构
4.2.1.1 ISO2709
4.2.1.2 MARC 21
4.2.1.3 UNIMARC
4.2.1.4 CNMARC
4.2.2 叙词表结构
4.1.2.1 MARC 21
4.1.2.2 Zthes Profile
4.2.3 XML
4.2.4 元数据
4.2.5 RDF
4.2.6 受控语言数据结构评述
4.3 通信协议
4.3.1 Z39.50协议
4.3.1.1 Z39.50概述
4.3.1.2 Z39.50应用大纲
4.3.1.3 Bath应用大纲
4.3.1.4 Z39.50/Web网关
4.3.1.5 Z39.50优缺点
4.3.1.6 Z39.50应用评价
4.3.2 HTTP协议
4.3.2.1 HTTP概述
4.3.2.2 网络数据库模式
4.3.2.3 HTTP的优缺点
4.3.2.4 HTTP协议的扩展
4.3.3 WHOIS++协议
4.3.4 OAI信息获取协议
4.3.5 受控语言通信协议评述
4.4 应用系统集成
4.4.1 参考文献链接
4.4.2 Web Service
4.4.3 受控语言元数据登记系统
4.4.4 专业应用系统
4.4.4.1 自动分类
4.4.4.2 全文检索系统
4.4.4.3 电子词典
4.4.4.4 电子书
4.4.4.5 个性化信息服务
4.4.4.6 受控语言的可视化
4.4.5 受控语言应用集成评述
5 受控语言应用试验
5.1 试验背景
5.2 目标
5.3 方法
5.4 过程
5.4.1 试验准备
5.4.1.1 硬件和网络环境
5.4.1.2 软件
5.4.1.3 试验数据
5.4.2 试验过程
5.4.2.1 ROADS的安装和调试
5.4.2.2 INDEXDATA的Z39.50软件包
5.4.2.3 丹诚公司的Z39.50客户端软件
5.4.2.4 导入试验数据
5.4.2.5 平台功能概述
5.4.3 试验框架
5.4.4 试验点
5.4.4.1 分类浏览
5.4.4.2 词表管理
5.4.4.3 检索中词表支持
5.4.4.4 Z39.50检索
5.4.4.5 Zthes Profile
5.4.4.6 都柏林核心集
5.4.4.7 交叉检索
5.5 结果
5.5.1 分类浏览结构
5.5.2 检索的查全率
5.5.3 HTTP/Z39.50/WHOIS++的兼容性
5.5.4 标准格式转换输出
5.5.5 对国内学科信息门户的建议
5.6 评价
5.6.1 集成性
5.6.2 扩展性
5.6.3 安全性
5.6.4 易用性
5.7 进一步试验
5.7.1 MARC格式的受控词表支持
5.7.2 互操作性试验
5.7.3 受控语言在信息获取和处理中的应用
5.8 试验总结
6 结论
7 附件
附件1 术语表
附件2 受控语言研究机构和项目
附件3 受控语言研究站点
附件4 XML叙词表
附件5 ZTHES PROFILE叙词
附件6 DOCUMENT和DC的字段对照表
附件7 DUBLINCORE模板的基本结构
8 主题索引
9 参考引用文献
10 发表文章和致谢
【参考文献】:
期刊论文
[1]开放数字环境下的参考文献链接[J]. 张晓林. 现代图书情报技术. 2002(01)
[2]网络专业指引库的构建理论及实现技术探讨[J]. 张雪英. 现代图书情报技术. 2000(06)
[3]90年代我国主题检索词表编制理论研究述评[J]. 朱蓓. 图书情报知识. 1999(02)
[4]试论一体化医学语言系统(UMLS)超级叙词表的特点[J]. 方平. 图书情报工作. 1998(10)
[5]联网环境中的情报检索语言研究[J]. 赵英莉. 图书情报工作. 1998(05)
[6]文献题名自动抽词——分类标引系统[J]. 张琪玉. 图书馆杂志. 1998(04)
[7]叙词表的分面化改造[J]. 张琪玉. 图书馆论坛. 1997(06)
[8]DDC:21世纪知识组织的工具[J]. 柴纯青. 图书馆. 1997(05)
[9]学科-事物概念组配型检索语言——关于情报检索语言的遐想与求索[J]. 张琪玉. 图书馆杂志. 1997(02)
[10]中外叙词表的发展[J]. 宋翠云. 河南图书馆学刊. 1995(04)
本文编号:3502161
本文链接:https://www.wllwen.com/tushudanganlunwen/3502161.html