个性化网络信息检索系统的研究与实现
发布时间:2020-12-30 20:05
提出了一种个性化网络信息检索系统(Personalized Internet Information Retrieval System,以下简称PIIRS),将网络信息查询与收集有机结合起来,建立面向用户兴趣的新型信息服务系统。PIIRS系统实现自动识别用户兴趣,自动生成用户角色模型,帮助用户生成检索请求,向用户推送信息等。同时,系统能根据用户兴趣模型判断返回结果和用户兴趣的匹配程度,并且实现全文提供功能。 论文分三个部分,共十一章。第一部分(第一章和第二章)为总论,首先论述了因特网信息资源开发利用的现状,分析了其中存在问题(第一章)。在此基础上分析了个性化信息检索的业务流程,给出了PIIRS系统的设计思想和原则,提出了PIIRS系统的整体结构,并对可行性进行了分析。第二部分(第三章至第六章)为关键技术研究,对用户建模技术、机器学习、搜索引擎技术、智能代理技术、WEB网页识别技术、信息过滤技术、数据挖掘技术、人机交互技术等相关技术进行研究和分析。第三部分(第七章至第十一章)为具体实现部分,详细地介绍了PIIRS系统的五个子系统的结构与技术实现,五个子系统分别为:用户需求与兴趣描述...
【文章来源】:中国科学院大学(中国科学院文献情报中心)北京市
【文章页数】:153 页
【学位级别】:博士
【文章目录】:
第一章 研究背景
第一节 因特网信息资源
一、 因特网的兴起与发展
二、 因特网信息资源的现状
第二节 因特网信息的获取方式及存在的问题
一、 传统的网络信息检索工具
二、 浏览器方式
三、 搜索引擎
四、 新兴的网上智能检索系统
第二章 个性化网络信息检索系统的分析与设计
第一节 个性化网络信息检索系统的目标与意义
一、 个性化网络信息检索系统的目标
二、 个性化网络信息检索系统的研究意义
第二节 个性化网络信息检索系统的分析与设计
一、 系统需求分析与业务流程
二、 PIIRS系统设计思想和原则
三、 PIIRS系统总体设计
四、 可行性分析
第三章 用户建模技术
第一节 用户兴趣与信息需求
一、 获得用户兴趣与信息需求的方式
二、 用户兴趣与信息需求分析
第二节 机器学习
一、 机器学习系统模型
二、 机器学习的方法
第三节 用户模型
一、 相关性及用户模型
二、 信息检索中的用户需求及用户建模
三、 基于用户模型的学习方法
第四章 因特网信息资源的发现和收集技术
第一节 搜索引擎
一、 搜索引擎及其构成
二、 搜索引擎的主要技术
第二节 元搜索引擎
一、 元搜索引擎及其构成
二、 元搜索引擎的主要技术
第三节 智能代理
一、 智能代理简介
二、 智能代理技术
第四节 WEB网页识别
一、 Web文档预处理
二、 文档特征的提取
三、 文档表示
第五章 因特网信息资源过滤技术与挖掘技术
第一节 信息过滤技术
一、 信息过滤的方法
二、 信息过滤算法
第二节 因特网信息资源的挖掘技术研究
一、 Web信息挖掘概述(Web Mining)
二、 网络信息挖掘中的技术研究
第六章 人机交互技术
第一节 用户界面
一、 用户界面概述
二、 用户界面技术应用
第二节 自然语言理解
一、 自然语言理解概述
二、 自然语言理解的应用
第三节 推拉技术(PUSH—PULL)
一、 信息推送模式
二、 信息拉取模式
三、 信息推拉模式
四、 智能信息推拉技术
第七章 用户需求与兴趣描述子系统的设计与实现
第一节 系统功能
一、 用户界面
二、 知识库
三、 查询模块
第二节 用户建模的具体实现
一、 用户模型设计
二、 主要模块的框架设计
三、 数据结构
四、 主要模块的实现
第八章 信息采集子系统的设计与实现
第一节 系统功能
一、 URL初始化
二、 Web页面的获取
三、 页面分析
四、 下载
五、 网页信息的更新与维护
六、 搜索控制
第二节 ROBOT引擎的技术实现
一、 Robot引擎流程
二、 Wininet API函数
三、 关键技术的实现
四、 主要界面
第九章 信息呈现与反馈子系统的设计与实现
第一节 系统功能
一、 结果显示
二、 推送服务
三、 用户反馈
四、 用户潜在需求挖掘
五、 用户行为监测
第二节 信息呈现与反馈子系统的实现
一、 信息呈现与反馈子系统的构成
二、 设计思想
三、 算法描述及主要函数
四、 结果显示界面
五、 其他显示界面
第三节 数据结构
一、 笔记本设计
二、 用户信息集合
三、 用户行为
四、 用户兴趣相关度
五、 其他数据表
第十章 主题挖掘子系统的设计与实现
第一节 系统功能
一、 系统自动挖掘
二、 主题归类
三、 文档训练
第二节 主题挖掘功能
一、 预处理
二、 分词
三、 文档训练
第三节 数据结构
第四节 文档训练的技术实现
一、 文档训练功能说明
二、 涉及的数据库表
三、 主要界面
第十一章 管理和调度子系统的设计与实现
第一节 建立初始URL库的目的
第二节 初始URL库的结构
第三节 网址分类体系
一、 按网络资源类型分类的体系
二、 按内容的分类体系
第四节 初始URL库与各个模块的关系
一、 与知识库的关系
二、 与Robot的联系
三、 与信息呈现与反馈模块的联系
第五节 模块的主要函数
一、 GetURL()
二、 AddURL()
三、 DeleteURL()
结束语
参考文献
发表论著目录
致谢
【参考文献】:
期刊论文
[1]Agent在智能信息检索中的应用研究[J]. 冯永杰,孟宾,翟玉庆. 计算机应用研究. 2002(02)
[2]元搜索引擎及其主要技术[J]. 李广建,黄崑. 情报科学. 2002(02)
[3]面向内容的信息服务研究[J]. 史田华,甘利人. 图书情报工作. 2002(02)
[4]基于Web挖掘的智能门户搜索引擎的研究[J]. 李岩,陈新中,杨炳儒. 计算机工程与应用. 2002(04)
[5]智能网站Agents的研究[J]. 殷信义,刘锦高,吴添华,何炜丽,Mohammed. 计算机应用研究. 2002(01)
[6]基于内容的网页特征提取[J]. 张义忠,赵明生,朱精南. 计算机工程与应用. 2001(10)
[7]无词典高频字串快速提取和统计算法研究[J]. 韩客松,王永成,陈桂林. 中文信息学报. 2001(02)
[8]Web网页识别算法研究[J]. 韩彬斌,王培康. 情报学报. 2001(01)
[9]HTML文档的模糊检索模型[J]. 丁永生,周斌,杨文春. 计算机工程与应用. 2001(03)
[10]信息检索向量空间模型中特征提取的研究[J]. 陶跃华,王锡钢,王云爱. 云南师范大学学报(自然科学版). 2000(06)
本文编号:2948228
【文章来源】:中国科学院大学(中国科学院文献情报中心)北京市
【文章页数】:153 页
【学位级别】:博士
【文章目录】:
第一章 研究背景
第一节 因特网信息资源
一、 因特网的兴起与发展
二、 因特网信息资源的现状
第二节 因特网信息的获取方式及存在的问题
一、 传统的网络信息检索工具
二、 浏览器方式
三、 搜索引擎
四、 新兴的网上智能检索系统
第二章 个性化网络信息检索系统的分析与设计
第一节 个性化网络信息检索系统的目标与意义
一、 个性化网络信息检索系统的目标
二、 个性化网络信息检索系统的研究意义
第二节 个性化网络信息检索系统的分析与设计
一、 系统需求分析与业务流程
二、 PIIRS系统设计思想和原则
三、 PIIRS系统总体设计
四、 可行性分析
第三章 用户建模技术
第一节 用户兴趣与信息需求
一、 获得用户兴趣与信息需求的方式
二、 用户兴趣与信息需求分析
第二节 机器学习
一、 机器学习系统模型
二、 机器学习的方法
第三节 用户模型
一、 相关性及用户模型
二、 信息检索中的用户需求及用户建模
三、 基于用户模型的学习方法
第四章 因特网信息资源的发现和收集技术
第一节 搜索引擎
一、 搜索引擎及其构成
二、 搜索引擎的主要技术
第二节 元搜索引擎
一、 元搜索引擎及其构成
二、 元搜索引擎的主要技术
第三节 智能代理
一、 智能代理简介
二、 智能代理技术
第四节 WEB网页识别
一、 Web文档预处理
二、 文档特征的提取
三、 文档表示
第五章 因特网信息资源过滤技术与挖掘技术
第一节 信息过滤技术
一、 信息过滤的方法
二、 信息过滤算法
第二节 因特网信息资源的挖掘技术研究
一、 Web信息挖掘概述(Web Mining)
二、 网络信息挖掘中的技术研究
第六章 人机交互技术
第一节 用户界面
一、 用户界面概述
二、 用户界面技术应用
第二节 自然语言理解
一、 自然语言理解概述
二、 自然语言理解的应用
第三节 推拉技术(PUSH—PULL)
一、 信息推送模式
二、 信息拉取模式
三、 信息推拉模式
四、 智能信息推拉技术
第七章 用户需求与兴趣描述子系统的设计与实现
第一节 系统功能
一、 用户界面
二、 知识库
三、 查询模块
第二节 用户建模的具体实现
一、 用户模型设计
二、 主要模块的框架设计
三、 数据结构
四、 主要模块的实现
第八章 信息采集子系统的设计与实现
第一节 系统功能
一、 URL初始化
二、 Web页面的获取
三、 页面分析
四、 下载
五、 网页信息的更新与维护
六、 搜索控制
第二节 ROBOT引擎的技术实现
一、 Robot引擎流程
二、 Wininet API函数
三、 关键技术的实现
四、 主要界面
第九章 信息呈现与反馈子系统的设计与实现
第一节 系统功能
一、 结果显示
二、 推送服务
三、 用户反馈
四、 用户潜在需求挖掘
五、 用户行为监测
第二节 信息呈现与反馈子系统的实现
一、 信息呈现与反馈子系统的构成
二、 设计思想
三、 算法描述及主要函数
四、 结果显示界面
五、 其他显示界面
第三节 数据结构
一、 笔记本设计
二、 用户信息集合
三、 用户行为
四、 用户兴趣相关度
五、 其他数据表
第十章 主题挖掘子系统的设计与实现
第一节 系统功能
一、 系统自动挖掘
二、 主题归类
三、 文档训练
第二节 主题挖掘功能
一、 预处理
二、 分词
三、 文档训练
第三节 数据结构
第四节 文档训练的技术实现
一、 文档训练功能说明
二、 涉及的数据库表
三、 主要界面
第十一章 管理和调度子系统的设计与实现
第一节 建立初始URL库的目的
第二节 初始URL库的结构
第三节 网址分类体系
一、 按网络资源类型分类的体系
二、 按内容的分类体系
第四节 初始URL库与各个模块的关系
一、 与知识库的关系
二、 与Robot的联系
三、 与信息呈现与反馈模块的联系
第五节 模块的主要函数
一、 GetURL()
二、 AddURL()
三、 DeleteURL()
结束语
参考文献
发表论著目录
致谢
【参考文献】:
期刊论文
[1]Agent在智能信息检索中的应用研究[J]. 冯永杰,孟宾,翟玉庆. 计算机应用研究. 2002(02)
[2]元搜索引擎及其主要技术[J]. 李广建,黄崑. 情报科学. 2002(02)
[3]面向内容的信息服务研究[J]. 史田华,甘利人. 图书情报工作. 2002(02)
[4]基于Web挖掘的智能门户搜索引擎的研究[J]. 李岩,陈新中,杨炳儒. 计算机工程与应用. 2002(04)
[5]智能网站Agents的研究[J]. 殷信义,刘锦高,吴添华,何炜丽,Mohammed. 计算机应用研究. 2002(01)
[6]基于内容的网页特征提取[J]. 张义忠,赵明生,朱精南. 计算机工程与应用. 2001(10)
[7]无词典高频字串快速提取和统计算法研究[J]. 韩客松,王永成,陈桂林. 中文信息学报. 2001(02)
[8]Web网页识别算法研究[J]. 韩彬斌,王培康. 情报学报. 2001(01)
[9]HTML文档的模糊检索模型[J]. 丁永生,周斌,杨文春. 计算机工程与应用. 2001(03)
[10]信息检索向量空间模型中特征提取的研究[J]. 陶跃华,王锡钢,王云爱. 云南师范大学学报(自然科学版). 2000(06)
本文编号:2948228
本文链接:https://www.wllwen.com/tushudanganlunwen/2948228.html