当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索引擎Google检索技巧研究

发布时间:2016-11-08 08:30

  本文关键词:搜索引擎Google检索技巧研究,由笔耕文化传播整理发布。


当前位置:首页 >> 经济学 >> 搜索引擎Google检索技巧研究


甘肃科技 第 21 卷   2 期 第 V ol . 21  No. 2                         2005 年 2 月 Feb.   2005 Gansu Science and Technology

搜索引擎 Goo gle 检索技巧研究
苏  云
( 兰州大学管理学院信息管理系 ,甘肃 兰州   730000)



摘   : 详细介绍了搜索引擎 Google 的各种搜索语法和使用技巧 ,对检索工作者提高网络检索能 要 力具有参考意义 。 关键词 : 搜索引擎 ; 搜索技巧 ; Google 中图分类号 : TP391. 3    英 语 中 没 有 Google 这 个 词 , 它 是 数 学 名 词 googol 的谐音 ,指 10 的 100 次方 。 Google 搜索引擎 的创 始 人 美 国 斯 坦 福 大 学 博 士 生 Larry Page 和 Sergey Brin 选择了这个词 , 使它成为目前世界上最 大、 、 最快 最强的搜索引擎 。据统计 , Google 支持多 达 132 种语言 ,包括简体中文和繁体中文 ; 它的搜索 资料库内包含 34 亿份文档 ,24 亿页网页 ,所有这些 文件 ,如果人工检索 ,以每分钟 1 页 ,24 小时不间断 工作 , 需要 5707 年才能完成一遍检索 , 而用 Google 检索 , 不超过 1 秒种 。Google 还收购世界上最大的 新闻组 Deja. com 的 7 亿份档案 , 包括 1 天前到 22 年前的 35000 个主题 ; Google 具有独到的图片搜索 功能 , 能搜索包含了 3. 3 亿个图形文件 , Google 在 2002 年就有 15000 多台服务器 ,200 多条 T3 级宽 带 。下面就作者使用 Google 的一点经验与同仁交 流。 近义词 、 多义词) 的规范 。 异体字) 和词义 ( 如同义词 、 例如 ,同义词” 计算机” 电脑”” 和” 、激光” 莱塞” 和” 、 “马铃薯” “土豆” 洋芋” ,从而使提高互联网上 和 “ 、 等 检索信息的查准率和查全率 。建议在选择关键词时 应注意这么几点 : 1. 1   选择专指性强的词 关键词专指性强弱是影响查准率的重要因素之 一 ,选用专指性强的关键词 ,就能检索出的网页针对 性较强 ,查准率较高 。专指性强弱是对选词表达主 题的深度而言 ,要深入分析检索主题 ,选择研究的对 象及其重要参数 、 概念等名词术语 ; 选择所应用的对 文章起关联作用的基础理论 、 方法 、 设备等名称 ; 选 择反映重要研究成果的词 。对于科学研究者来说应 该多用学术名称和术语 。 1. 1. 1   学科名称 学科名称可以作为关键词进行选择 , 学科名称 常常可以作为一个主要的关键词加以使用 。例如 , 检索课题 : 天体物理学的研究进展情况 。可以在 Google 搜索框内输入 “天体物理学 研究进展” : 。 1. 1. 2   事物名称和机构名称 事物名称作为关键词也是搜索信息的常用办 法 。例如 , 检索课题 : 挑战者号航天飞机的失事情 况 。可以在 Google 搜索引擎中输入 “挑战者号 爆 炸”或者 ; “挑战者号 失事”就可以搜索到准确的信 , 息。 1. 1. 3   人物名称 人物名称也是搜索引擎中常用到的关键词 。例 如 ,检索课题 : 查找金庸写了多少武侠小说 。可以通 过 Google 搜索 ,输入关键词 “金庸 武侠小说” : 。 1. 2   多角度选词 关键词的确定必须经过对检索主题正确分析得


1  Google 的关键词选择
所谓搜索 , 就是在正确的地方使用正确的工具 和正确的方法寻找正确的信息内容 , 这里正确的方 法主要是选择恰当和合适的关键词 。Google 的关键 词可以是字 、 单词 , 也可以是短语 、 词组或句子 。尤 其对复杂课题检索 ,主题分析后就要进行正确选词 。 Google 的不同关键词的选择和使用 , 不但决定着检 索结果排列不同 , 而且如果选词不准 , 也无法发挥 Google 强大的检索功能 ,影响检索效率 。 关键词 ( Keyword) 是指从文档的标题 、 文摘以 及正文中抽取的对表达文档主题起关键作用且具有 检索意义的词语 ,它是未经过严格的规范化处理 ,属 于自然语言的范畴 ,所以检索时就要考虑词类 、 词形 ( 如英语中的单复数 ,汉语中汉字的简体字 、 繁体字 、

? 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved.

                                            21 卷 甘 肃 科 技 第 70 到 。复杂主题的关键词 , 要将反映该主题的各个主 要方面的词汇都提炼出来 ,以此提高文献的查全率 。 例如 ,查找“搜索引擎发展的历史” 因为搜索引擎 , 的历史 ,是与互联网早期的文件检索工具 Archie ” “ 相关的 。此外 ,搜索引擎有个核心程序 ,叫“蜘蛛” , 而最早成型的搜索引擎是“Lycos” Yahoo ” 它们 、 “ , 是优秀搜索引擎的代表 。因此 , 除了选择“搜索引 擎” 历史” , 还要选择 Archie ” 蜘蛛” Lycos” “ 、 外 “ 、 “ 、 “ “Yahoo ” 等词 。这些词都是起关键作用的检索词 。 1. 3   选择限制主题的词 在关键词确定之后 , 并不能保证检索出来的信 息都满意 , 有时查询的结果太多太泛 。由于 Google 只搜索包含关键词的网页 , 除了增加表达主题的关 键词 ,还可增加限制性的词语作为关键词 ,以排除多 余的信息 。例如 : 输入 “图书馆 - 甘肃” 将会找到 , 关于 “图书馆” 但不含 “甘肃图书馆” 的网页 。 1. 4   选择几个句型搜索 1. 4. 1   “什么是 …… 句型查到名词和事件 用 ” 例如 , 检索课题 : 什么是 BBS ? 在 Google 中直 接输入疑问句 , 可以检索出 BBS 是 Bulletin Board
System 的简称 ,即电子公告板 。 1. 4. 2   “如何 …… 句型查找疑惑和解决问题的 用 ”

用的辅助词 。

2  Google 检索语法
为了完整准确地表达检索需求 , 提高检索的精 确度 ,正确选择关键词后 ,还需要了解和运用 Google 各种检索语法与技巧 , 根据 Google 提供的操作 、 运 算符和使用规则说明 ,设计出一个高质量的检索式 。 2. 1   site 语法对指定的站点搜索 用 site 语法表示搜索结果局限于某个具体网站或 者网站频道 。例如 , 搜索中文教育科研网站上关于 搜索引擎技巧的网页 。搜索语法 : 搜索引擎 技巧 site :edu. cn 。 2. 2   filetyp e 语法对文件类型搜索 用 filetype 语法是非常实用的搜索语法 。 Google 不仅能搜索一般的 HTML 的文字页面 ,还能检索一 些二进制文档 。目前 , Google 已经能检索微软的 Office 文档如 . xls 、ppt 、 doc ,. rtf , WordPerfect 文 . . 档 ,Lot us1 - 2 - 3 文档 ,Adobe 的 . pdf 文档 , Shock2 Wave 的 . swf 文档等 。例如 , 搜索关于搜索引擎知 识和技巧方面的英文 PDF 文档 , 搜索语法 : ” search
2. 3   intitle 语法对主题类别搜索 用 intitle 语法是对对网页的标题栏进行查询 。所

engine”tips OR t utorial filetype :pdf ” 。

方法 例如 ,检索课题 : 如何挑选显示器 ? 如何进行网 上交易 ? 在 Google 中键入这两个句型 ,可以得到满 意的结果 。 1. 4. 3   “ …… 用 已成为” 句型帮助用户扩展思路和 启发想象力 这是一个很有用的句型 。例如 ,检索课题 : 抑郁 症的现状 。可以利用 Google 当输入 “抑郁症已成 为” 这个句子 。再例如 , 检索课题 : 互联网目前的发 展状况 。可输入 “互联网已成为” 检索结果中的许 , 多的 “图书馆已成为 …… 可以引导用户的思路 , 从 ” 而写出一篇精彩文章 。 1. 5   合理地应用辅助词 辅助词是能表达主题意义但不是名词的自然 词 ,是一个难以定义的词汇 。这类词使用是否得当 , 有时对检索结果有很大的影响 。例如 ,检索课题 : 我 国生物技术在哪些地方比较发达 ? 思考这个检索课 题时 ,就要考虑 “发达” 这个意思如何用关键词表达 。 经过分析得知检索意图是要找出我国自己的生物技 术研究机构的分布 ,这样就达到了检索目标 。因此 , 在检索时要细致地分析课题的意图 , 不能生搬检索 课题中的词汇 ,要按课题的实质性的含义 ,选用好适

谓的网页标题 , 就是 HTML 标记语言 < title > < / title > 中之间的部分 。网页设计的一个原则就是要

把主页的关键内容用简洁的语言表示在网页标题 中 。因此 ,只查询标题栏 ,通常也可以找到高相关率 的专题网页 。例如 , 查找抗非典的科技前沿信息 。 搜索语法 :intitle : SARS 科技 。 2. 4   inurl 语法对链接类别搜索 用
inurl 语法检索网页链接中包含第一个关键字 ,

? 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved.

后面的关键字是出现在链接中或者网页文档中的 。 因为很多网站把某一类具有相同属性的资源名称显 示在 目 录 名 称 或 者 网 页 名 称 中 , 比 如“ M P3 ” 、 “RM” IMA GE” GALLAR Y” , 所以 , 可以用 in2 “ 、 “ 等
url 语法找到这些相关资源链接 , 再用第二个关键词

确定是否有某项具体资料 。它通常能提供非常精确 的专题资料 。例如 , 查找刀郎的 2004 年的第一场 《 雪》搜索语法 :2004 年的第一场雪 inurl : mp3 , 我们 , 还可以用 ” inurl : news” 查找新闻 ,” inurl :images” 查

找图片等 。 2. 5   link 语法搜索某个网站的所有链接 用 如果你拥有一个个人网站 , 想知道有多少人对 你的网站作了链接 ,link 语法就能让你迅速达到这


第 2 期              苏云 : 搜索引擎 Google 检索技巧研究 个目的 。link 语法还有其它妙用 。一般说来 , 做友 情链接的网站都有相似地方 , 可以通过这些友情链 接 ,找到一大批具有相似内容的网站 。例如 ,你是个 天文爱好者 ,当你发现某网站非常不错 ,可以用 link 语法查一下与之做链接的网站 , 一定能找到更多符 合你兴趣的天文爱好者内容 。

71

分析 : 可以非常直接的用” 姚明 胸围” 进行搜 索 ,但事实上 ,这样检索出的结果 , 是关于姚明的一 些新闻 ,无法快速得到所需要的资料 。可以想到的 是 ,需要的资料应该包含在姚明的全面介绍性文字 中 ,除了胸围 ,应该还包括他的身高 、 、 体重 生日等一 系列相关信息 。这样就可以进一步的增加其它约束 性关键词以缩小搜索范围 。其实一个人在网上揭示 的资料通常有许多 ,例如 : 姓名 、 、 、 、 网名 性别 年龄 毕 业学校 、 工作单位 、 外号 、 住址 、 电话 、 信箱 、 P 、 B 手机 号码 、 号 、 ICQ 号等等 , 所以 , 如果你想了解一 ICQ O 下你多年没见过的同学 , 不妨用上述信息做关键字 进行查询 ,也许会有不错的收获 ,我们称这种检索方 法为 Google 的相关词检索法 。 示例 4 : 用 Google 找软件 WinRAR 分析一 : 很多网站设有专门的下载目录 ,而且就 命名为” download” 因此 , 可以用 inurl 语法直接搜 , 索该下载目录 。 搜索语法 :winrar 8. 0 inurl :download 分析二 : 互联网上随意下载软件是不安全的 ,因 为供下载的软件有可能带有病毒或者捆绑了木马 , 所以 ,对下载网站作限定 ,是一个稳妥的思路 。可以 用 site 语法达到这个目的 。 搜索语法 :winrar 8. 0 site :newhua. com. cn 示例 5 : 用 Google 找电影明星布兰妮的图片 分析一 : 利用专门的图片目录 ,这是由于提供图 片的网站通常会把图片放在某个专门目录下 , 如 gallary 、 album 、 photo 、 image 等 , 这样就可以使用 in2 url 语法迅速找到这类目录 。 搜索语法 : ” ney spears” brit inurl :photo 分析二 : 利用提供图片集合的网页 ,在标题栏内 通常会注明 ,这是谁的图片集合 ,于是就可以用 inti2 tle 语法找到这类网页 。 搜索语法 :intitle : ” ney spears” ure brit pict 分析三 : 明星的 FANS 通常会申请免费个人主 页来存放他们偶像的靓照 。于是用 site 语法指定某 个主页提供站点 ,也是个迅速找到图片的好办法 。 分析四 : filetype 语法的后缀能够限定图片的 类型 ,如 J P G , GIF 等 。 搜索语法 : ” ney spears” brit filetype :jpg OR file2 type :gif 示例 6 : 用 Google 找 《堂吉诃德》 这本书 分析一 : 网上访问的电子图书馆类网站有许多 , 比如综合类的 “超星” 文艺类的 , “书库” , 因此 , 找 等 书的关键 ,是要了解一大批著名的 ( 下转第 56 页)


3  Google 检索实例分析
关键词的选择在 Google 搜索中起到决定性的 作用 ,所有搜索技巧中 ,关键词选择是最基本也是最 有效的 ,但也不能与检索语法一同使用 ,下面具体举 例说明 。 示例 1 : 查找 《镜花缘》 一书中淑士国酒保的酸 话原文 。 分析 : 如果按照一般的思路 ,查找某部小说中的 具体段落 , 就需要用 Google 搜索引擎先找到这本 书 ,然后再翻到该段落 ,但效率很低 。如果了解目标 信息的构成 ,用一些目标信息所特有的字词 ,可以非 常迅速的查到所需要的资料 。也就是说 , 高效率的 搜索关键字不一定就是目标信息的主题 。在上面的 例子中 ,酒保谈到酒的浓淡与贵贱的关系时 ,之乎者 也横飞 。因此 ,就可以用特定的词语迅速找到目标 资料 ,称为 Google 的特定词检索法 。 搜索语法 : ” 贵 贱 之” 酒 检索结果说明 : 找到结果的第一条信息就是镜 花缘的这一段落 : ” 先生听者 : 今以酒醋论之 ,酒价贱 之 ,醋价贵之 。因何贱之 ? 为甚贵之 ? 真所分之 ,在 其味之 。酒昧淡之 , 故而贱之 ; 醋味厚之 , 所以贵 之。 ” 示例 2 : ” 黄花闺女” 一词中” 黄花” 是什么意思 ? 分析 : ” 黄花闺女” 是一个约定的俗语 , 如果只 用” 黄花闺女 黄花” 做关键词 , 搜索结果将浩如烟 海 ,没什么价值 , 因此必须要加更多的关键词 , 约束 搜索结果 。选择什么关键词呢 ? 备选的有” 意思”” 、 含义”” 、来历”” 、由来”” 、典故”” 、出典”” 、渊源” , 等 可以猜到的是 ,类似的资料 ,应该包含在一些民俗介 绍性的文章里 ,所以用诸如” 来历”” 、由来”” 、出典” 等词汇的概率更高一些 , 这种检索方法称为 Google 的近义词检索法 。 搜索语法 : ” 黄花闺女 黄花 由来” 检索结果说明 : 查到” 黄花” 原来出典于 《太平御 览》与南朝的寿阳公主有关 。如果想获得第一手资 , 料 ,就可以用” 太平御览 寿阳公主” 做搜索了 。 示例 3 : 篮球明星姚明的胸围是多少 ?

? 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved.

                                            21 卷 甘 肃 科 技 第 56

图5  基于彩色静止数字图像的信息隐藏提取过程

   算法 4 ( 基于彩色静止数字图像的信息隐藏嵌 入算法) 1. 将待隐藏信息 ( 以下称签字信号 ) 的字节长 度写入 BM P 文件标头部分的保留字节中 ; 2. 将签字信号转化为二进制数据码流 ;
3. 将 BM P 文件图像数据部分的每个字节的高 7 位依次异或后再与上述二进制数码流异或后的结

= ( X7 ( X6 ( X6

X6

X5

X4

X3

X2

X1 X1

X7 ) X7 )

X5 X4 X3 X2 X1 S) = ( X7 X6 X5 X4 X3 X2 X5 X4 X3 X2 X1 S=S

5  结束语
数字水印技术是一种横跨信号处理 、 数字通信 、 密码学 、 计算机网络等多学科的新兴技术 ,具有巨大 的潜在应用市场和重要的学术和经济价值 。为了促 进国内信息隐藏技术的研究和应用 , 我国信息安全 领域的三位院士与有关应用研究单位联合发起了我 国的信息隐藏学术研讨会 , 并于 1999 年 12 月组织 召开了第一届会议 , 与会者就数字水印技术的发展 动态和趋势进行了全面 、 深入的探讨 。 参考资料 :
[1]   陈彤 ,等 . 图像隐含信息方法的研究 . 北京理工大学学

果写入最低位 ; 算法 5 ( 基于彩色静止数字图像的信息隐藏提 取算法)
1. 读 BM P 文件标头部分的保留字节值 , 设为 L ,若为 0 则没有隐藏信息 , 终止算法 ; 若不为 0 则

其值为隐藏信息的字节长度 ; 将 BM P 文件图像数据部分的每个字节 8 位依 次异或 ,并保存其结果 ; 1. 重复第 ( 2) 步 ,使每 8 个 BM P 文件图像数据 部分字节经过运算后组成一个隐藏信息字节 ; ( 2. 重复 ( 2) 、3) 直到隐藏信息字节长度为 L 。 可以证明 ,提取后的信息就是嵌入的签字信号 。 以签字信号的一个位 S 为例 , 设对应的一个位图数 据字节为 X7X6X5X4X3X2X1X0 , 嵌入签字信号后 的位图数据字节为 X7X6X5X4X3X2X1X0 ’ 其中 : , X0’ = X7 X6 X5 X4 X3 X2 X1 S 设提取后的签字信号为 S’则 , S’ X7 X6 X5 X4 X3 X2 X1 0’ =

报 ,1997 ,17 ( 6) .
[2]   钟玉琢 ,等 . 多媒体计算机技术基础及应用 [ M ] . 高等

教育出版社 ,1999.
[ 3 ]  IEEE Std. 1363 - 2000. IEEE Standard Specifications for Public - key [ 4 ]  Rising M. Implementing Elliptic Curve Cryptography. Greenwich. [ 5 ]  Guajardo J , Paar C , Itoh - Tsujii. Inversion in Standard Basis and Its [6]   Schroeppel R ,Orman H ,O’ Malley S. Fast Key Exchange wit h Elliptic

  ( 上接第 71 页) 图书馆网站的网址 ,然后可以用 site 语法很简单的找到某本书 。 搜索语法 : 堂吉诃德 site :shuku. net 分析二 : 用特定词检索法 ,这对于迅速找到某书 或者文章是极其有用的 ,当然 ,这是建立在你已经读 过该书 ,对书的内容有印象的基础上 。例如你想了 解 《堂吉诃德》 一书战风车的大致内容 , 搜索语法 : ”

堂吉诃德 风车 桑乔” 这样可以迅速找到该书的某 个章节的某一段落 。总而言之 , Google 作为互联网 上最有力的搜索引擎 ,被越来越多的网民们接受 ,其 中有好多方便实用的搜索方法等待我们去发掘 。 参考文献 :
[1]   李国辉 ,汤大汉 . 信息组织与检索 . 科学出版社 ,2003 [2]   http :/ / Google. com

? 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved.





  本文关键词:搜索引擎Google检索技巧研究,由笔耕文化传播整理发布。



本文编号:167574

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/167574.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a0083***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com