科技政策领域的个性化语义检索系统研究
发布时间:2017-10-25 16:36
本文关键词:科技政策领域的个性化语义检索系统研究
【摘要】:随着国家科技水平的不断发展提高,科技政策逐渐成为我国政策体系中至关重要的部分,科技政策的相关研究也逐渐引起我国学术界以及政界等众多学者的关注和重视。对于科技政策研究者来说,如何在大量政策文件中快速定位到自己感兴趣的信息是他们十分关注的问题。针对目前信息检索技术中忽略对语义信息和用户信息等方面因素的考虑而导致查全率和查准率较低的问题,本文在以《河北省科技政策数据管理服务平台》项目系统为依托的背景下,对基于科技政策领域本体的语义关联和用户个性化信息检索展开研究,主要研究内容包括:(1)科技政策领域本体的构建。本文是基于科技政策领域的研究,在中国科学院颁布的公文主题词表的基础上,分析科技政策领域特点并主要参照七步法来构建科技政策领域本体。(2)深入研究信息检索以及本体的相关知识与技术,提出基于科技政策领域本体的概念语义扩展方法,根据领域本体概念以及概念间关系等方面对用户输入的查询进行语义扩展,以提高信息检索结果的查全率。(3)深入研究Lucene搜索引擎、个性化信息检索的相关知识与技术,基于用户信息以及查询记录,利用LDA主题模型来建立用户兴趣模型,获取用户某段时期所关注的对象内容,并根据用户模型优化Lucene文档评分计算方法,设计了依据用户兴趣实现的个性化信息检索系统,给出用户模型的建立过程以及检索排序算法的优化过程。(4)以《河北省科技政策数据管理服务平台》项目系统为依托,增加其全文检索功能并进行优化,采用JSP语言在Lucene开源框架的基础上构建个性化信息检索功能模块,通过爬虫来搜集科技政策文件信息,整理存储到数据库,然后构建索引及实现查询,根据语义扩展检索词以及用户兴趣模型进行文档相似度计算,使系统更好理解用户查询语义信息,并且把与用户兴趣有关的文档得分升高,进而影响文档的排名。最后通过实验验证本文方法,能够提高系统检索功能的查全率、查准率以及实现个性化检索,增强用户查询满意度。
【关键词】:科技政策 领域本体 个性化 语义检索
【学位授予单位】:石家庄铁道大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-14
- 1.1 课题研究背景与意义8-9
- 1.2 国内外研究现状9-12
- 1.2.1 科技政策研究现状9-10
- 1.2.2 本体相关研究现状10-11
- 1.2.3 个性化信息检索研究现状11-12
- 1.3 主要研究内容12-13
- 1.4 论文组织结构13-14
- 第二章 相关基本知识和技术14-23
- 2.1 领域本体相关知识14-16
- 2.1.1 领域本体构建准则14
- 2.1.2 领域本体构建方法14-15
- 2.1.3 领域本体构建工具15-16
- 2.1.4 领域本体的描述语言16
- 2.2 Jena简介16-17
- 2.3 Lucene搜索引擎17-19
- 2.3.1 Lucene简介17
- 2.3.2 Lucene系统结构17-19
- 2.4 用户兴趣模型概述19-22
- 2.4.1 个性化检索中用户兴趣模型建立19-20
- 2.4.2 用户兴趣模型表示方法20
- 2.4.3 LDA主题模型20-22
- 2.5 本章小结22-23
- 第三章 科技政策领域本体构建23-34
- 3.1 科技政策领域本体构建流程设计23-24
- 3.2 科技政策领域本体构建过程24-30
- 3.2.1 确定本体领域及范围24
- 3.2.2 考虑现有本体重用24-25
- 3.2.3 确定科技政策领域本体概念25-26
- 3.2.4 领域本体概念间关系26-27
- 3.2.5 定义概念的属性27-29
- 3.2.6 添加实例29-30
- 3.3 科技政策领域本体表示与存储30-33
- 3.4 本章小结33-34
- 第四章 基于科技政策领域本体的语义扩展及个性化处理34-46
- 4.1 本体扩展查询34-39
- 4.1.1 查询扩展概述34-35
- 4.1.2 本体扩展查询流程35-37
- 4.1.3 本体概念语义相似度计算37-39
- 4.2 用户兴趣模型的构建39-42
- 4.2.1 用户兴趣数据的采集39-40
- 4.2.2 基于LDA的用户兴趣模型建立40-42
- 4.3 Lucene个性化排序算法的实现42-45
- 4.3.1 Lucene排序算法介绍42-44
- 4.3.2 基于用户兴趣模型的排序算法改进44-45
- 4.4 本章小结45-46
- 第五章 个性化语义检索系统设计及实验分析46-59
- 5.1 科技政策领域个性化语义检索系统设计46-53
- 5.1.1 系统框架整体设计46-47
- 5.1.2 系统各模块的实现47-53
- 5.2 系统开发平台及实验53-58
- 5.2.1 系统开发平台及工具53
- 5.2.2 查全率、查准率以及F值对比实验53-56
- 5.2.3 个性化测试实验56-58
- 5.3 本章小结58-59
- 第六章 总结与展望59-61
- 6.1 总结59-60
- 6.2 展望60-61
- 参考文献61-65
- 致谢65-66
- 个人简历、在学期间的科研成果以及发表的学术论文66
【相似文献】
中国期刊全文数据库 前10条
1 张慧;蒋开伟;冯玉珉;;图像和视频的语义检索[J];科技信息;2006年10期
2 李晨光;;基于本体的网络问答式语义检索系统[J];科技情报开发与经济;2008年32期
3 黄敏;赖茂生;;语义检索研究综述[J];图书情报工作;2008年06期
4 胡哲;郑诚;王艳玲;;语义检索关键技术研究[J];计算机技术与发展;2008年10期
5 刘珊慧;万韵;杨乐;;基于本体的农业信息资源语义检索过程研究[J];安徽农业科学;2009年23期
6 楚书来;张瑞;;基于本体的语义检索技术研究[J];黑龙江科技信息;2010年24期
7 付苓;崔新春;谢娟;连慧平;;基于语义信息链的语义检索研究[J];山东图书馆学刊;2010年04期
8 张世勇;陈运启;;基于概念匹配的语义检索模型研究[J];重庆工商大学学报(自然科学版);2010年05期
9 马中杰;郑诚;苏喻;;一种基于知识库的语义检索系统模型[J];微型机与应用;2010年20期
10 李林;王红;付宇;杨璇;王静;;民航突发事件应急案例语义检索方法研究[J];计算机工程与设计;2011年03期
中国重要会议论文全文数据库 前7条
1 王洪俊 ;沈水荣 ;黄,
本文编号:1094614
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1094614.html