搜索引擎结果排序中模糊聚类算法及推荐技术的应用
发布时间:2014-09-16 15:55
【摘要】 如今互联网上资源的丰富和人们对互联网的依赖,使得人们在浏览网络资源的同时想的更多的是如何能快速、准确地从互联网上获取对自己有用的信息。搜索引擎系统就成为了最受欢迎的获取网络资源的工具。然而,人们在体验搜索引擎系统带来方便时,也体会到了要获取准确、有用的网络资源所带来的困难。目前的搜索引擎主要的思路是将查询关键词与互联网上的资源进行匹配,再返回检索结果。但查询的关键词含有多种语义,从而使得检索的结果存在着主题漂移的现象。而且用户需要在检索结果中进行不断的筛选,以此来寻找有用的资料,这使得用户需要耗费大量的时间在检索结果上。为了解决以上问题,本文提出了一种基于模糊聚类算法的搜索引擎结果排序新方法,即IPCM算法。为了优化检索结果的排序,本文将传统的推荐技术进行了融合,形成了融合推荐算法。并将IPCM算法和融合推荐算法相结合,应用到搜索引擎结果排序中。并通过实验验证了算法的可行性和优越性。本文有以下三个创新点:(1)提出了一种改进的PCM算法,即IPCM算法。本文为了克服了PCM算法对初始值敏感的问题,将用户的兴趣爱好模型作为IPCM算法的初始矩阵。以用户兴趣爱好为模型的初始矩阵符合用户检索的习惯,使IPCM算法在更新聚类中心和更新分类矩阵收敛之后所得到的结果更符合用户所查询的主题,防止了主题漂移。(2)将传统推荐技术进行融合形成了一种融合推荐算法。对于传统推荐的技术,采取取长补短的方法,对基于用户协同过滤推荐技术、基于内容的推荐技术这两种技术进行融合,并将融合推荐算法运用到搜索引擎中。该融合推荐算法对搜索引擎结果排序有较好的优化能力。而且,当使用IPCM算法出现错误时,融合推荐算法在一定程度上对搜索引擎结果排序进行了弥补。(3)提出了一种基于模糊聚类算法及融合推荐算法的搜索引擎结果排序新方法。该算法是将IPCM算法和融合推荐算法进行结合后,应用到搜索引擎结果排序中。算法避免了检索主题的漂移问题,提高了搜索引擎检索的效率。 还原
【关键词】 搜索引擎; 模糊聚类; 初始矩阵; 推荐技术; 用户兴趣爱好;
现阶段,用户对于搜索结果的要求不满足于单一结果的呈现,而是希望搜索结果更具个性化,搜索结果能够按照一定的主次顺序排列出来,给用户多种选择。基于模糊聚类算法及推荐技术的搜索引擎结果能够进一步细化搜索数据,从而使用户从中挑选最符合心理预期的内容,这两项技术的应用能够在一定程度上保障搜索数据的准确性。
1 搜索引擎结果排序所依托的技术项目内容提要
1.1 模糊聚类算法
模糊聚类算法分析是数据挖掘领域的核心技术之一。模糊C-均值聚类算法是一种基于原型的聚类算法。从以往综合搜索引擎技术的发展过程来看,它能够解决大量数据的复杂形态处理问题。模糊聚类算法具有操作简单、手段高效、数据适应性强等执行特征[1]。从近年来国内相关领域的研究资料中可以看到,模糊聚类算法分析是搜索引擎技术环节中使用最为频繁的算法和研究内容。
1.2 推荐技术
将传统推荐技术与搜索引擎结果排序进行整合,有效避免了推荐技术在实践过程中的信息繁杂性,优化了搜索结果的精准度。推荐技术是针对用户的所搜索的关键词而扩展而来的综合信息推荐技术,它是一种收集并整合信息的过程,同时具有一定的复杂性[2]。正是这些特点的存在,使得传统推荐技术出现了种种问题,即用户还需要在繁杂的数据中搜索与目标对象有关的数据,这就影响搜索数据信息的及时性。
2 通过多种技术的整合能够解决搜索引擎结果单一化的问题
在目前,诸多应用领域都采取有效的搜索本文由笔耕文化传播http://www.bigengculture.com/收集整理方式进行整合与提取信息,以便于实现数据互通的效果。在一般搜索引擎上,只要采用相同的关键词,则大家所搜索到的词条结果是一致的。但正是这种搜索引擎结果的单一性,使得搜索被业界技术工作者萌生了进一步开发搜索技术的想法,使其能够满足用户的个性化需求。基于此,基于模糊聚类算法及推荐技术的搜索引擎结果排序研究被更多的专业人士所关注,并且取得了良好的研究成果。从实践应用来看,该项技术整合理念与研究内容较为可行。
2.1 探究模糊聚类算法的应用对于搜索引擎结果排序的影响
模糊聚类算法的实际应用对于搜索引擎结果的正确排序有着极为深远的影响。从操作步骤来看,模糊聚类算法的实践应用过程中被业界所看重的关键研究内容有四点:1)如何对FCM算法中目标函数恰当定义使该目标函数既能反映有关“数据距离”的要求原则,又能体现各个特征以及不同样本的重要性,模糊聚类算法的应用使搜索引擎结果更加有序;2)无论FCM算法中目标函数如何定义,均会有相应的聚类原型与之对应,从而收敛速度甚至聚类效果必然依赖初始划分,如何建立一种基于模糊理论的聚类算法来规避聚类原型的问题,即从根本上解决对初始划分的敏感性,只有这样,才能解决搜索引擎结果的精准度问题;3)如何恰当的去刻画半监督FCM算法,使监督样本既能体现其典型性,又不失其局限性;4)如何减少FCM算法的计算量问题,该项问题是否能够处理的得当,不仅关系到搜索引擎结果排序的质量,而且对于用户执行搜索任务的体验感受有着直接影响[3]。总之,模糊聚类算法与搜索引擎结果排序之间有着细微的关联。
2.2 探究推荐技术的应用对于搜索引擎结果排序的影响
推荐技术的应用能够最大化的丰富搜索引擎结果排序的内容,使得用户的搜索结果更具个性化的特点,以便于用户从中挑选中最为合适的搜索内容,提高搜索效率[4]。一般情况下,如果系统所推荐的项目是以文本的方式呈现,那么文本词汇就是系统执行搜索的主要依据。系统通过词条特点将搜索引擎检索的结果进行分类,从而将数据按照一定的次序排列出来,用户就可以根据排序结果选择与搜索关键词最为贴切的项目,直至完成搜索任务。基于用户的系统过滤推荐技术是现代网络信息处理环节中最为高校的一种搜索技术,它具有很重要的现实意义。
3 基于模糊聚类算法与推荐技术应用模式下的搜索引擎结果排序研究
解决搜索结果单一的方法是提供个性化服务,并依托模糊聚类算法和推荐技术等内容共同实现智能搜索,将搜索结果按照一定的顺次呈现给用户[5]。另外,在实践过程中,也可以通过Web数据挖掘技术,构建完整的用户模型,包括用户背景、搜索行为、查询风格等等,通过这些细节的实施与完善,为用户提供更多个性化服务,同时使得搜索引擎结果排序更为精准,提升用户搜索的效率。
4 结束语
通过对搜索引擎结果排序所依托的技术项目的研究,分别阐述模糊聚类算法及推荐技术的概念及特点,进一步探究模糊聚类算法的应用对于搜索引擎结果排序的影响,以及推荐技术的应用对于搜索引擎结果排序的影响,并且细致分析了在二者共同作用下搜索引擎结果排序的变动。从各项研究内容中我们可以明确一个问题,即搜索引擎结果排序方式受到了模糊聚类算法与推荐技术等现代化手段的影响,其应用结果较为显著,值得在相关技术领域中推广实施。
参考文献:
本文编号:9008
【关键词】 搜索引擎; 模糊聚类; 初始矩阵; 推荐技术; 用户兴趣爱好;
现阶段,用户对于搜索结果的要求不满足于单一结果的呈现,而是希望搜索结果更具个性化,搜索结果能够按照一定的主次顺序排列出来,给用户多种选择。基于模糊聚类算法及推荐技术的搜索引擎结果能够进一步细化搜索数据,从而使用户从中挑选最符合心理预期的内容,这两项技术的应用能够在一定程度上保障搜索数据的准确性。
1 搜索引擎结果排序所依托的技术项目内容提要
1.1 模糊聚类算法
模糊聚类算法分析是数据挖掘领域的核心技术之一。模糊C-均值聚类算法是一种基于原型的聚类算法。从以往综合搜索引擎技术的发展过程来看,它能够解决大量数据的复杂形态处理问题。模糊聚类算法具有操作简单、手段高效、数据适应性强等执行特征[1]。从近年来国内相关领域的研究资料中可以看到,模糊聚类算法分析是搜索引擎技术环节中使用最为频繁的算法和研究内容。
1.2 推荐技术
将传统推荐技术与搜索引擎结果排序进行整合,有效避免了推荐技术在实践过程中的信息繁杂性,优化了搜索结果的精准度。推荐技术是针对用户的所搜索的关键词而扩展而来的综合信息推荐技术,它是一种收集并整合信息的过程,同时具有一定的复杂性[2]。正是这些特点的存在,使得传统推荐技术出现了种种问题,即用户还需要在繁杂的数据中搜索与目标对象有关的数据,这就影响搜索数据信息的及时性。
2 通过多种技术的整合能够解决搜索引擎结果单一化的问题
在目前,诸多应用领域都采取有效的搜索本文由笔耕文化传播http://www.bigengculture.com/收集整理方式进行整合与提取信息,以便于实现数据互通的效果。在一般搜索引擎上,只要采用相同的关键词,则大家所搜索到的词条结果是一致的。但正是这种搜索引擎结果的单一性,使得搜索被业界技术工作者萌生了进一步开发搜索技术的想法,使其能够满足用户的个性化需求。基于此,基于模糊聚类算法及推荐技术的搜索引擎结果排序研究被更多的专业人士所关注,并且取得了良好的研究成果。从实践应用来看,该项技术整合理念与研究内容较为可行。
2.1 探究模糊聚类算法的应用对于搜索引擎结果排序的影响
模糊聚类算法的实际应用对于搜索引擎结果的正确排序有着极为深远的影响。从操作步骤来看,模糊聚类算法的实践应用过程中被业界所看重的关键研究内容有四点:1)如何对FCM算法中目标函数恰当定义使该目标函数既能反映有关“数据距离”的要求原则,又能体现各个特征以及不同样本的重要性,模糊聚类算法的应用使搜索引擎结果更加有序;2)无论FCM算法中目标函数如何定义,均会有相应的聚类原型与之对应,从而收敛速度甚至聚类效果必然依赖初始划分,如何建立一种基于模糊理论的聚类算法来规避聚类原型的问题,即从根本上解决对初始划分的敏感性,只有这样,才能解决搜索引擎结果的精准度问题;3)如何恰当的去刻画半监督FCM算法,使监督样本既能体现其典型性,又不失其局限性;4)如何减少FCM算法的计算量问题,该项问题是否能够处理的得当,不仅关系到搜索引擎结果排序的质量,而且对于用户执行搜索任务的体验感受有着直接影响[3]。总之,模糊聚类算法与搜索引擎结果排序之间有着细微的关联。
2.2 探究推荐技术的应用对于搜索引擎结果排序的影响
推荐技术的应用能够最大化的丰富搜索引擎结果排序的内容,使得用户的搜索结果更具个性化的特点,以便于用户从中挑选中最为合适的搜索内容,提高搜索效率[4]。一般情况下,如果系统所推荐的项目是以文本的方式呈现,那么文本词汇就是系统执行搜索的主要依据。系统通过词条特点将搜索引擎检索的结果进行分类,从而将数据按照一定的次序排列出来,用户就可以根据排序结果选择与搜索关键词最为贴切的项目,直至完成搜索任务。基于用户的系统过滤推荐技术是现代网络信息处理环节中最为高校的一种搜索技术,它具有很重要的现实意义。
3 基于模糊聚类算法与推荐技术应用模式下的搜索引擎结果排序研究
解决搜索结果单一的方法是提供个性化服务,并依托模糊聚类算法和推荐技术等内容共同实现智能搜索,将搜索结果按照一定的顺次呈现给用户[5]。另外,在实践过程中,也可以通过Web数据挖掘技术,构建完整的用户模型,包括用户背景、搜索行为、查询风格等等,通过这些细节的实施与完善,为用户提供更多个性化服务,同时使得搜索引擎结果排序更为精准,提升用户搜索的效率。
4 结束语
通过对搜索引擎结果排序所依托的技术项目的研究,分别阐述模糊聚类算法及推荐技术的概念及特点,进一步探究模糊聚类算法的应用对于搜索引擎结果排序的影响,以及推荐技术的应用对于搜索引擎结果排序的影响,并且细致分析了在二者共同作用下搜索引擎结果排序的变动。从各项研究内容中我们可以明确一个问题,即搜索引擎结果排序方式受到了模糊聚类算法与推荐技术等现代化手段的影响,其应用结果较为显著,值得在相关技术领域中推广实施。
参考文献:
- [1] 王文钧,李巍. 垂直搜索引擎的现状与发展探究[J]. 情报科学. 2010(03)
- [2] 段淮川,胡平. 基于主题特征和时间因子的改进PageRank算法[J]. 计算机工程与设计. 2010(04)
- [3] 肖仙桃,王丹丹. 用户信息环境、信息行为及信息需求发展趋势[J]. 图书馆理论与实践. 2010(01)
- [4] 姚文琳,刘文. 一种基于本体的PageRank算法的改进策略[J]. 计算机工程. 2009(06)
- [5] 张春元,康耀红,伍小芹. Web信息检索排序算法研究[J]. 海南大学学报(自然科学版). 2009(01)
- [6] 王崝,鞠时光. 基于时间维加权TimedWPR算法[J]. 计算机工程与设计. 2008(12)
本文编号:9008
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/9008.html
上一篇:没有了
下一篇:中国象棋机器博弈系统中哈希技术的应用探讨
下一篇:中国象棋机器博弈系统中哈希技术的应用探讨