智能搜索引擎信息过滤机制研究
本文关键词:智能搜索引擎信息过滤机制研究,由笔耕文化传播整理发布。
选填,简要介绍文档的主要内容,方便文档被更多人浏览和下载。
图书与情报
学术方阵
2007年第4期
智能搜索引擎信息过滤机制研究
张摘
帆
林
建(华中师范大学信息管理系
湖北武汉
430079)
要:智能搜索引擎是人工智能技术和传统搜索引擎技术相结合的产物。面对信息无时无刻不在进行更替的网络环境,智能搜索引擎具有
自然语言过滤智能化、多文档处理智能化、用户服务智能化等信息处理机制。为促进智能搜索引擎发展,应重视用户建模技术研究,加强基于多
Agent智能搜索引擎系统的研制与实践,加大智能搜索引擎关键技术研究力度。
关键词:智能搜索引擎中图分类号:TP391.3
信息过滤自然语言理解人工智能
文章编号:1003-6938(2007)04-0052-05
文献标识码:A
ResearchonFilteringMechanisminIntelligentSearchEngine
ZhangFan
LinJian(DepartmentofInformationManagement,HuaZhongNormalUniversity,Wuhan,,Hubei,430079)
Abstract:Intelligentsearchengineisaproductthatcombinesthetraditionalsearchenginetechnologyandartificialintelligencetechnology.Facingtheincessantlyinformationchangingofenvironmentalnetwork,theintelligentsearchenginecansolvetheproblembythemechanismthatintelligentfiltersofnaturallanguage,intelligentmulti-documentprocessingandintelligentcustomerservices.Topromotethedevelopmentofintelligentsearchengines,weshouldpaymoreattentiononusermodelingtechnology,enhancesearchengineresearchbasedonMulti-AgentSystemandpracticeintensifiedresearchinkeytechnologiesofsmartsearchengine.Keywords:intelligentsearchengine;informationfiltering;naturallanguageunderstanding;artificialintelligenceCLCnumber:TP391.3
Documentcode:A
(2007)04-0052-05ArticleID:1003-6938
20世纪80年代以来,国内外种类繁多的搜索引擎,如
拦Google、Altavista、Sohu等在为用户提供浏览和查询信息、截与过滤不良信息和无用信息方面起到了一定的作用,成为广大网络用户获取网络信息的首选工具。但是,随着网络信息的爆炸性增长及用户信息需求的个性化发展,搜索引擎简单的过滤网络信息状况已难以满足用户精确查询信息的需要。百度、天网三大中文搜索引擎杜亚军等人曾对Google中文、
的智能性进行过测试,[1]测试结果表明,基于关键词的搜索引擎在“容错性”(用户检索结果集与其真正需要的匹配程度)、“适语性”(查询的结果与查询概念书面用语的耦合程度)及“个性化”(针对不同用户提供针对性信息)等方面的智能较差,并指明上述三个引擎均未能满足及要“适应性”“个别性”求,惟有百度对用户的误输入有一定的辨别能力。
由此可见,传统的基于Web搜索引擎虽然在索引库构建上不完全一致,但其缺陷大致相同。其一,查询效率低下,主要体现在和两个方面。笔者最近做了一“大海捞针”“资源漏检”个简单的实验,利用Google引擎查询有关的研究信“基因”息,点击后系统反馈有25,100,000个网页。假设一秒钟浏览一个网页,则需要6962个小时查阅完这些结果信息。在网络信息爆炸性增长的今天,不可能有用户会花费这么多的时间与精力来浏览搜索到的每一个网页,何况大部分网页内容和查询意图并不相关,因此,要获得真正需要的信息宛如大海捞针。是指传统搜索引擎由于不能理解和联想用户“资源漏检”的检索需要而致使信息丢失的现象。笔者使用一词进“红薯”行检索时,虽然获得了数量巨大的结果网页,但是仍然丢失了以白薯、地瓜、红苕、番薯等同义概念和近意概念为标引词的
基金项目:本文系国家社科基金项目(06BTQ024)研究成果之一。收稿日期:2006-12-29;责任编辑:王景发
52
本文关键词:智能搜索引擎信息过滤机制研究,由笔耕文化传播整理发布。
本文编号:60305
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/60305.html