数据挖掘技术在个性化信息检索系统中的应用研究
发布时间:2021-08-20 13:25
随着网络应用的普及,网上信息量以惊人的速度增长,并且更新频繁。人们面对的问题不再是缺乏有用信息,而是如何找到自己所需要的信息。虽然传统信息检索技术在一定程度上满足了人们的需要,但却存在着低查准率和低查全率的问题。多数商业搜索引擎提供的信息检索服务,由于侧重通用性而不能满足不同背景、不同目的用户的查询请求。针对这种现状,作者研究了基于数据挖掘的个性化信息检索系统。论文首先对搜索引擎系统的研究现状和发展趋势进行论述,探讨了将数据挖掘技术应用于个性化信息检索系统的可行性,在此基础上提出了一个基于数据挖掘的个性化信息检索系统的总体框架模型。接着对该系统的主要功能进行较深入的描述,对该系统的的关键技术进行较深入的研究。最后给出了一种基于Apriori的类别关联规则的挖掘算法。仿真结果表明基于Apriori的类别关联规则的挖掘算法能够挖掘出用户的个性化信息,同时表明用户个性化信息的质量好坏与支持度值的大小密切相关。
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
PIRSBDM 系统体系结构
部分的内容将在本章后面章节进行介绍。关联规则挖掘的基本模型如图 4.1 所示。图4.1 关联规则挖掘步骤图中 D 为数据集,算法 1 为频繁项目集的搜索算法,算法 2 为关联规则的产生算法,R 为挖出的关联规则集合。用户通过指定 minsupport 和 minconfidence 分别与算法 1 和算法 2 交互,并通过与 R 的交互对挖掘结果进行解释和评估。本文利用算法 1 挖掘出频繁项目集作为用户个性化信息,所以只需指定 minsupport 即可。对于本系统来说,我们只需挖掘出用户的关键词组合作为数据集 D,设定好minsupport 的值
第四章 PIRSBDM 系统关键技术研究 4聚类方法相比,SOM 网络的优点在于:可以实现实时学习,网络具有自稳定性无须外界给出评价函数,能够识别向量空间中最有意义的特征,抗噪音能力强这些特点将有利于 Web 文档的聚类。SOM 网络由输入层和竞争层组成,输入层N 个输入神经元组成,竞争层由 M 个输出神经元组成。输入层各神经元与竞争各神经元之间实现全互连接。如图 4.4 所示,为清楚起见,仅画出各输入神经元竞争层神经元 j 的连接情况,网络的连接权值为ijw (i=1,2,…,N;j=1,2,…,M)。
【参考文献】:
期刊论文
[1]基于用户的个性化智能搜索引擎[J]. 金玉坚,刘焱. 现代情报. 2005(07)
[2]一种基于关联分类方法的Web用户兴趣预测[J]. 陈振,郑诚,朱小栋. 微机发展. 2005(05)
[3]搜索引擎Google的检索规则[J]. 吴敏. 兰台世界. 2005(07)
[4]几类搜索引擎的原理剖析、比较研究及发展趋势探讨[J]. 黄知义,周宁. 图书馆学研究. 2005(03)
[5]论搜索引擎的人性化发展趋势[J]. 李苏华,李建伟. 中山大学学报论丛. 2005(01)
[6]Google和百度两种搜索引擎比较研究[J]. 王香莲. 现代图书情报技术. 2004(08)
[7]模糊关联规则的挖掘算法[J]. 徐凤生,陆玉昌. 德州学院学报(自然科学版). 2002(02)
[8]一种基于SOM的中文Web文档层次聚类方法[J]. 陈福集,杨善林. 情报学报. 2002(02)
[9]Archie,Gopher,WAIS和WWW——Internet网上主要信息查询工具介绍[J]. 黄静. 图书馆学刊. 2001(03)
[10]Web搜索引擎的现状分析[J]. 吴果. 河南纺织高等专科学校学报. 2001(02)
博士论文
[1]电子政务系统中面向公众的信息集成化管理与个性化服务研究[D]. 陈福集.合肥工业大学 2004
硕士论文
[1]关联规则挖掘技术研究[D]. 郎瑾.西安电子科技大学 2005
[2]个性化智能信息检索系统研究[D]. 顾鑫.哈尔滨工程大学 2004
本文编号:3353580
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
PIRSBDM 系统体系结构
部分的内容将在本章后面章节进行介绍。关联规则挖掘的基本模型如图 4.1 所示。图4.1 关联规则挖掘步骤图中 D 为数据集,算法 1 为频繁项目集的搜索算法,算法 2 为关联规则的产生算法,R 为挖出的关联规则集合。用户通过指定 minsupport 和 minconfidence 分别与算法 1 和算法 2 交互,并通过与 R 的交互对挖掘结果进行解释和评估。本文利用算法 1 挖掘出频繁项目集作为用户个性化信息,所以只需指定 minsupport 即可。对于本系统来说,我们只需挖掘出用户的关键词组合作为数据集 D,设定好minsupport 的值
第四章 PIRSBDM 系统关键技术研究 4聚类方法相比,SOM 网络的优点在于:可以实现实时学习,网络具有自稳定性无须外界给出评价函数,能够识别向量空间中最有意义的特征,抗噪音能力强这些特点将有利于 Web 文档的聚类。SOM 网络由输入层和竞争层组成,输入层N 个输入神经元组成,竞争层由 M 个输出神经元组成。输入层各神经元与竞争各神经元之间实现全互连接。如图 4.4 所示,为清楚起见,仅画出各输入神经元竞争层神经元 j 的连接情况,网络的连接权值为ijw (i=1,2,…,N;j=1,2,…,M)。
【参考文献】:
期刊论文
[1]基于用户的个性化智能搜索引擎[J]. 金玉坚,刘焱. 现代情报. 2005(07)
[2]一种基于关联分类方法的Web用户兴趣预测[J]. 陈振,郑诚,朱小栋. 微机发展. 2005(05)
[3]搜索引擎Google的检索规则[J]. 吴敏. 兰台世界. 2005(07)
[4]几类搜索引擎的原理剖析、比较研究及发展趋势探讨[J]. 黄知义,周宁. 图书馆学研究. 2005(03)
[5]论搜索引擎的人性化发展趋势[J]. 李苏华,李建伟. 中山大学学报论丛. 2005(01)
[6]Google和百度两种搜索引擎比较研究[J]. 王香莲. 现代图书情报技术. 2004(08)
[7]模糊关联规则的挖掘算法[J]. 徐凤生,陆玉昌. 德州学院学报(自然科学版). 2002(02)
[8]一种基于SOM的中文Web文档层次聚类方法[J]. 陈福集,杨善林. 情报学报. 2002(02)
[9]Archie,Gopher,WAIS和WWW——Internet网上主要信息查询工具介绍[J]. 黄静. 图书馆学刊. 2001(03)
[10]Web搜索引擎的现状分析[J]. 吴果. 河南纺织高等专科学校学报. 2001(02)
博士论文
[1]电子政务系统中面向公众的信息集成化管理与个性化服务研究[D]. 陈福集.合肥工业大学 2004
硕士论文
[1]关联规则挖掘技术研究[D]. 郎瑾.西安电子科技大学 2005
[2]个性化智能信息检索系统研究[D]. 顾鑫.哈尔滨工程大学 2004
本文编号:3353580
本文链接:https://www.wllwen.com/tushudanganlunwen/3353580.html