基于文献计量的我国搜索引擎研究现状和热点分析.doc 全文免费在线阅读
本文关键词:基于文献计量的我国搜索引擎研究现状和热点分析,由笔耕文化传播整理发布。
网友2786321826近日为您收集整理了关于基于文献计量的我国搜索引擎研究现状和热点分析的文档,,希望对您的工作和学习有所帮助。以下是文档介绍:.页眉.页脚..基于文献计量的我国搜索引擎研究现状和热点分析摘要:运用文献计量的方法对我国搜索引擎领域的相关文献进行多角度的定量和定性分析,明晰搜索引擎研究领域的主要研究机构、核心作者和核心期刊,并通过论文关链词和主题分析,发现目前的研究热点主要集中于4个方面:(1)搜索引擎的基本原理和关键技术;(2)元、垂直、个性和智能等4种搜索引擎研究;(3)搜索引擎的应用及商业盈利;(4)搜索引擎相关的知识产权等法律问题4个方面。关键词:搜索引擎;文献计量;研究现状;热点近年来,由于网络和信息技术的快速发展,互联网上的信息成爆炸式的增长,网络成为了人们发布和获取信息的重要渠道,然而网络信息过于分散和无序的分布使得用户获取信息遇到很大困难。在这种背景下,搜索引擎提供的信息服务方式也越来越重要。搜索引擎是一种用于帮助因特网用户在互联网上查询信息的搜索工具,它以一定的策略在因特网中发现、搜集信息,并对搜集的信息进行加工整理和组织存贮,为用户提供检索服务,从而起到信息导航的作用。搜索引擎产生于20世纪90年代。产生的时间虽不长,但已经在学术界、商业界以及人们的日常生活中发挥了巨大的作用,根据中国互联网信息中心2010年7月发布的《中国互联网络发展状况统计报告》第26次调查统计报告显示搜索引擎用户规模已达3.2亿人在各类网络应用使用率中的排名位居第三,这使得网络搜索引擎的研究成为当前国内外研究的热点。为.页眉.页脚..了解我国近年来在该领域的研究现状、热点以及分析其发展趋势,笔者拟用文献计量的方法对我国搜索引擎领域的相关文献进行以定量分析。希冀得出一些有益的结论,为该领域的研究提供借鉴。hg0088、数据来源和研究思路1.KI)中的数据库之一“中国学术期刊网出版总库”作为数据来源,文献发表时间截止到2011年底,检索时间为2012年1月,以“题名”为检索途径,以“搜索引擎”为检索词进行检索,得到检索结果为3814条数据。除去20条为各类研讨会征稿通知,剩余3794条为和搜索引擎相关的文献数据。1.2研究思路本文首先采用文献计量方法对相关文献的数量、著者分布、期刊分布、主要研究机构进行分析以揭示研究现状,然后对数据进行抽样,选取发表时间为近五年即2007-2011年的核心期刊论文,对其所研究的主题内容进行分析从而揭示出该领域的研究热点及发展趋势。KI自带的检索结果分组和Excel进行数据统计。2、文献调研与分析结果2.1文献信息量统计发表文献的数量在一定程度上代表了某个领域的研究水平与发展趋势。图1所示的是1996-2011年16年间的文献量,.页眉.页脚..其中2011年的数据可能还有部分文献没有上传到网上,估计全部数据应比2010年数据相差不多。从图中可以看出从1996-2004年是搜索引擎相关的论文的迅猛增期,在这个数据库中从1996年才出现的搜索引擎相关文献,到2004.年已经迅猛发展到300多篇,此后发文量进入稳步发展期,从2007年有一个发展高峰,2008-2009年达到顶峰,从2010年略有下降。应该是进入又一稳定发展时期。考查文献内容可知,搜索引擎的发展已经从诞生、迅猛发展、平稳发展,进入专门化深入化研究。这也表明对搜索引擎这一领域研究的逐步成熟。据此可以预见在未来一段时间内,搜索引擎研究仍将是我国学者关注的热点之一。2.2论文著者统计分析对于作者发文量的统计分析可以识别某研究领域的高产作者。本文选取发文量5篇以上的作者作为高产作者,共31人,共发文211篇如表1所示。对高产作者发文量的统计中发现很多作者是合著者,我们知道第一作者是论文的主要责任人和撰写人,选取以第一作者身份发表论文的作者统计如表2所示。对论文被引频次的统计可反映其及学术影响力。截止检索日被引次数前十的高被引作者如表3所示。被引频次排在第一的是来自华东理工大学的陈树年教授,他是我国著名情报检索语言专家,长期从事检索语言的.页眉.页脚..研究、教学和实践工作,在分类法、主题法以及网络信息组织研究领域有较高的造诣。从表2和表3我们也可以看出高产作者和高被引作者基本不一致,这说明虽然近年来对搜索引擎的研究比较热门投入到这一领域的专家也非常多,但专注于此的人并不多。高产并且高影响力的专家还显缺乏。其中只有张卫丰教授是既高产又高被引的作者,他主要从事Web应用技术、模式分类、搜索引擎技术、人工智能、机器学习、数据挖掘以及信息获取等方面的研究,是年轻一代的专家。2.3高产机构分析发表论文在20篇以上的高产机构如表4所示:从论文数量上看,武汉大学以80篇的数量排在第一位。排在第二的是北京大学,其他排名比较靠前的还有中山大学、清华大学、南京大学等。该领域的高产机构主要是我国发达地区的重点高校,其中武汉大学、北京大学、南京大学和中山大学皆是在图书情报领域研究比较突出的研究机构,清华大学是计算机学科领域领先的机构。表明高校的图书情报学院对搜索引擎的研究做出了贡献。也有少数综合实力不是很强的高校在搜索引擎研究比较突出,如佳木斯大学排名14,共产出22篇论文。2.4载文的期刊分布载文量在14篇以上的期刊有57种,所载论文总数为1947篇,占所有论文的49%。载文在34篇以上的期刊有20种,所.页眉.页脚..载论文总数为1168篇,占所有论文的31%,如表5所示。其中lO种期刊属于计算机软件与应用领域,8种期刊属于图书情报领域,还有2种是综合性期刊。表明对搜索引擎的研究主要来自以上两个领域的专业工作者。2.5高频关键词分析关键词所占篇幅虽小,却是文章的核心和精髓,是作者对文章主题的精炼,具有很强的代表性,因此高频的关键词往往被用来考查一个领域的研究热点。表6列出的是出现频次排在前二十的关键词:排在第一的关键词是搜索引擎,这是本文的检索词,也是本研究的基础所在。第二类较靠前的的关键词包括信息检索、互联网、因特网、、检索、网络,都是与主题很相关的词,是很多其他研究的基础。其中互联网、意思一致,在很多场合不明显区分的。搜索引擎处理的是因特网上的信息,因特网的迅速发展与普及也带动了搜索引擎的发展。因特网上的信息具有的庞大性、动态性、异构性和半结构化等特点对搜索引擎来说是个挑战,这势必引起很多专家学者来对此进行研究。因此,这是该领域的热点之一。第三类排名靠前的关键词是元搜索引擎、个性化、垂直搜索引擎、智能搜索引擎。目前。网上综合性的传统搜索引擎发展日益成熟,能够较好地满足广大用户的检索需求。但网络技术发展与网络信息增长迅速,网络信息的用户也越来越多,综合搜索引擎在信息.页眉.页脚..查准率低、有用信息含量低等方面也问题突出。因此,应开发搜索质量更准确、相关性更复杂的搜索引擎,以追求有最佳的检索效率及效果,各种元搜索引擎、垂直搜索引擎、个性化搜索引擎、智能搜索引擎等随之产生。成为当前搜索引擎研究的热点也是搜索引擎发展的趋势。第四类比较靠前的关键词是Lucene、中文分词、网络蜘蛛和数字挖掘,这些是搜索引擎的关键技术和搜索引擎工作的基础。很大程度上决定了搜索引擎的质量。Google出作为作为全球最大的搜索引擎也同时受到国内学者的关注。
12>
播放器加载中,请稍候...
系统无法检测到您的Adobe Flash Player版本
建议您在线安装最新版本的Flash Player 在线安装
本文关键词:基于文献计量的我国搜索引擎研究现状和热点分析,由笔耕文化传播整理发布。
本文编号:197700
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/197700.html