Wednesday, November 08, 2006

GOOGLE搜索法sekcu

基本搜索:+-OR

GOOGLE無需用明文的“+”來表示邏輯操作,隻要空格就可以了。

示例:搜索所有包含關鍵詞易筋經吸星大法的中文網頁
搜索:易筋經 吸星大法
結果:已搜索有關易筋經 吸星大法的中文(簡體)網頁。共約有726查詢結果,這是第1-10項。搜索用時0.13秒。

注意:文章中搜索語法外面的引號僅起引用作用,不能帶入搜索欄內。

GOOGLE用減號“-”表示邏輯操作。

示例:搜索所有包含易筋經而不含吸星大法的中文網頁
搜索:易筋經 -吸星大法
結果:已搜索有關易筋經 -吸星大法的中文(簡體)網頁。共約有5,440查詢結果,這是第1-10項。搜索用時0.13秒。

注意:這裡的“+”“-”號,是英文字符,而不是中文字符的。此外,操作符與作用的關鍵字之間,不能有空格。比如易筋經 - 吸星大法,搜索引擎將視為邏輯操作,中間的“-”被忽略。

GOOGLE用大寫的“OR”表示邏輯操作。但是,關鍵字為中文的或查詢似乎還有BUG,無法得到正確的查詢結果。

示例:搜索包含布蘭妮“Britney”或者披頭士“Beatles”、或者兩者均有的中文網頁。
搜索:“britney OR beatles”
結果:已搜索有關britney OR beatles的中文(簡體)網頁。共約有14,600查詢結果,這是第1-10項。搜索用時0.08秒。
搜索:布蘭妮 OR 披頭士
結果:找不到和您的查詢-布蘭妮 OR 披頭士-相符的網頁。

注意:小寫的“or”,在查詢的時候將被忽略;這樣上述的操作實際上變成了一次查詢。

“+”“-”的作用有的時候是相同的,都是為了縮小搜索結果的範圍,提高詢結果命中率。

例:查閱天龍八部具體是哪八部。

分析:如果光用天龍八部做關鍵字,搜索結果有26,500項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的資訊。可以用兩個方法減少無關結果。

1,如果你知道八部中的某一部,比如阿修羅,增加阿修羅關鍵字,搜索結果就隻有995項,可以直接找到全部八部,天龍八部 阿修羅

2,如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄,查詢結果為1,010項,可以迅速找到需要的資料,天龍八部 佛教 -金庸

,輔助搜索:通配符、大小寫、句子、忽略字符以及強制搜索

GOOGLE不支持通配符,如“*”“?”等,隻能做精確查詢,關鍵字後面的“*”或者“?”會被忽略掉。

GOOGLE對英文字符大小寫不敏感,“GOD”“god”搜索的結果是一樣的。

GOOGLE的關鍵字可以是片語(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。

示例:搜索包含“long, long ago”字串的頁面。
搜索:“"long, long ago"”
結果:已向英特網搜索"long, long ago". 共約有28,300查詢結果,這是第1-10項。搜索用時0.28秒。

注意:和搜索英文關鍵字串不同的是,GOOGLE對中文字串的處理並不十分完善。比如,搜索“"啊,我的太陽"”,我們希望結果中含有這個句子,事 實並非如此。查詢的很多結果,我的太陽等詞語是完全分開的,但又不是 我的 太陽這樣的與查詢。顯然,GOOGLE對中文的支持尚有欠缺之處。

GOOGLE對一些網路上齣現頻率極高的詞(主要是英文單詞),如“i”“com”,以及一些符號如“*”“.”等,作忽略處理,如果用戶必須要求關鍵字中包含這些常用詞,就要用強制語法“+”

示例:搜索包含“Who am I ?”的網頁。如果用“"who am i ?"”“Who”“I”“?”會被省略掉,搜索將隻用“am”作關鍵字,所以應該用強制搜索。
搜索:“"+who +am +i"”
結果:已向英特網搜索"+who +am +i". 共約有362,000查詢結果,這是第1-10項。搜索用時0.30秒。

注意:英文符號(如問號,句號,逗號等)無法成為搜索關鍵字,加強制也不行。

五,高級搜索:sitelinkinurlallinurlintitleallintitle

“site”表示搜索結果局限於某個具體網站或者網站頻道,如“sina.com.cn”“edu.sina.com.cn”,或者是某個域名,如“com.cn”“com”等等。如果是要排除某網站或者域名範圍內的頁面,隻需用“-網站/域名

示例:搜索中文教育科研網站(edu.cn)上所有包含金庸的頁面。
搜索:金庸 site:edu.cn”
結果:已搜索有關金庸 site:edu.cn的中文(簡體)網頁。共約有2,680查詢結果,這是第1-10 。搜索用時0.31秒。

示例:搜索包含金庸古龍的中文新浪網站頁面,
搜索:金庸 古龍 site:sina.com.cn”
結果:已在sina.com.cn搜索有關金庸 古龍的中文(簡體)網頁。共約有869查詢結果,這是第1-10項。搜索用時0.34秒。

注意:site後的冒號為英文字符,而且,冒號後不能有空格,否則,“site:”將被作為一個搜索的關鍵字。此外,網站域名不能有“http” “www”前綴,也不能有任何“/”的目錄尾碼;網站頻道則隻局限頻道名.域名方式,而不能是域名/頻道名方式。諸如金庸 site:edu.sina.com.cn/1/”的語法是錯誤的。

“link”語法返回所有鏈結到某個URL地址的網頁。

示例:搜索所有含指向華軍軟體園“www.newhua.com”鏈結的網頁。
搜索:“link:www.newhua.com”
結果:搜索有鏈結到www.newhua.com的網頁。共約有695查詢結果,這是第1-10項。搜索用時0.23秒。

注意:“link”不能與其他語法相混合操作,所以“link:”後面即使有空格,也將被GOOGLE忽略。

inurl語法返回的網頁鏈結中包含第一個關鍵字,後面的關鍵字則齣現在鏈結中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目 錄名稱或者網頁名稱中,比如“MP3”“GALLARY”等,於是,就可以用INURL語法找到這些相關資源鏈結,然後,用第二個關鍵詞確定是否有某項 具體資料。INURL語法和基本搜索語法的最大區別在於,前者通常能提供非常精確的專題資料。

示例:查找MIDI滄海一聲笑
搜索:“inurl:midi 滄海一聲笑
結果:已搜索有關inurl:midi 滄海一聲笑的中文(簡體)網頁。共約有14查詢結果,這是第1-10項。搜索用時0.01秒。

示例:查找微軟網站上關於windows2000的安全課題資料。
搜索:“inurl:security windows2000 site:microsoft.com”
結果:已在microsoft.com內搜索有關 inurl:security windows2000的網頁。共約有198查詢結果,這是第1-10項。搜索用時0.37秒。

注意:“inurl:”後面不能有空格,GOOGLE也不對URL符號如“/”進行搜索。GOOGLE“cgi-bin/phf”中的“/”當成空格處理。

allinurl語法返回的網頁的鏈結中包含所有查詢關鍵字。這個查詢的對象隻集中於網頁的鏈結字符串。

示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN錄中含有PHF腳本程式(這個腳本是不安全的),表現在鏈結中就是域名/cgi-bin/phf”
語法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特網搜索allinurl:"cgi-bin" phf +com. 共約有40查詢結果,這是第1-10項。搜索用時0.06秒。

allintitleintitle的用法類似於上面的allinurlinurl,隻是後者對URL進行查詢,而前者對網頁的標題欄進行查 詢。網頁標題,就是HTML標記語言title中之間的部分。網頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。因此,隻查詢標題 欄,通常也可以找到高相關率的專題頁面。

示例:查找日本明星藤原紀香的照片集。
搜索:“intitle:藤原紀香 寫真
結果:已搜索有關intitle:藤原紀香 寫真的中文(簡體)網頁。共約有284查詢結果,這是第1-10項。搜索用時0.03秒。

GOOGLE的罕用高級搜索語法:relatedcacheinfo

related用來搜索結構內容方面相似的網頁。例:搜索所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),“related:www.sina.com.cn/index.shtml”

cache用來搜索GOOGLE伺服器上某頁面的緩存,這個功能同網頁快照,通常用於查找某些已經被刪除的死鏈結網頁,相當於使用普通搜索結果頁面中的網頁快照功能。

info用來顯示與某鏈結相關的一系列搜索,提供cachelinkrelated和完全包含該鏈結的網頁的功能。

示例:查找和新浪首頁相關的一些資訊。
搜索:“info:www.sina.com.cn”
結果:有關www.sina.com.cn的網頁資訊。

No comments: