熱心網(wǎng)友
搜索引擎(search engines)是對互聯(lián)網(wǎng)上的信息資源進行搜集整理,然后供你查詢的系統(tǒng),它包括信息搜集、信息整理和用戶查詢?nèi)糠??! ∷阉饕媸且粋€為你提供信息“檢索”服務的網(wǎng)站,它使用某些程序把因特網(wǎng)上的所有信息歸類以幫助人們在茫茫網(wǎng)海中搜尋到所需要的信息。 早期的搜索引擎是把因特網(wǎng)中的資源服務器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進行分類。人們要找自己想要的信息可按他們的分類一層層進入,就能最后到達目的地,找到自己想要的信息。這其實是最原始的方式,只適用于因特網(wǎng)信息并不多的時候。隨著因特網(wǎng)信息按幾何式增長,出現(xiàn)了真正意義上的搜索引擎,這些搜索引擎知道網(wǎng)站上每一頁的開始,隨后搜索因特網(wǎng)上的所有超級鏈接,把代表超級鏈接的所有詞匯放入一個數(shù)據(jù)庫。這就是現(xiàn)在搜索引擎的原型。
熱心網(wǎng)友
一、什么叫搜索引擎? 在Internet上有上百億可用的公共Web頁面,即使是最狂熱的沖浪者也不會訪問到所有的頁面,而只能看到其中的一小部分,更不會在這浩瀚的Web海洋中發(fā)現(xiàn)你那即使精彩卻渺小的一隅。當然你可以為你的存在做廣告,可以用大大的字把你的URL刻在你的身體上,然后裸體穿過白宮草坪,但你得保證媒體正好在那里,并注視到了這一切。與其這樣做,不如好好去理解搜索引擎是如何工作的?又怎樣選擇和使用"keywords"(關鍵詞)等等。 本文的目的就是讓眾多的頁面設計者在了解搜索引擎的基礎上,尋求如何使自己的頁面在搜索引擎索返回的列表中獲得好的排列層次的方法。 "搜索引擎"這個術語一般統(tǒng)指真正意義上的搜索引擎(也就是全文檢索搜索引擎)和目錄(即目錄式分類搜索引擎),其實他們是不一樣的,其區(qū)別主要在于返回的搜索結(jié)果列表是如何編排的。 二、搜索引擎是如何工作的? 搜索引擎有三個主要的基本部分。 1、搜索引擎蜘蛛 搜索引擎首先利用的是一種俗稱蜘蛛(Spider)或爬蟲(Crawler)的軟件。搜索引擎蜘蛛訪問到一個頁面,讀取它,然后跟隨這個頁面鏈接到這個站點的其他頁面,這就是人們所說的站點被套住了或者被爬過了。蜘蛛會按照固定的時間不斷的回來訪問這個站點,如每月或每兩個月,以便查看頁面的變化。 2、索引 蜘蛛所找到的每一個頁面放入搜索引擎的第二部分--索引。索引也可以說是目錄冊,就像一本巨大的書,書中包含了蜘蛛所找到的每個Web頁的拷貝。如果Web頁改變了,這本書當然也會更新。但有時蜘蛛發(fā)現(xiàn)了新的Web頁和Web頁的變化,并不是馬上加到索引中去,當中間隔一段時間,就是說一個Web頁被爬過了,但卻不能被索引,直到這個Web頁被加到了索引里才可用于搜索引擎的搜索。 3、分析軟件 搜索引擎分析軟件是一個搜索引擎的第三部分。這個程序詳細審查記錄在索引中的成百上億的Web頁,找出與搜索要求相匹配的那些,并按他認為最合適的相關性排列出列表,呈現(xiàn)在沖浪者的面前。 三、搜索引擎如何排列Web頁面 用你所喜歡的搜索引擎搜索任何東西,搜索引擎幾乎立刻就從他知道的幾百萬的頁面中挑選出與你的主題相匹配的那些,呈現(xiàn)在你的熒屏上。這些網(wǎng)頁按一定的順序排列起來,最相關的排在最前面。 但搜索引擎并不是圖書管理員,他沒有能力一再地詢問有關的問題來更好地定位搜索的目標,也不能依靠智力判斷和過去的經(jīng)驗來排列網(wǎng)頁,而人可以做到。智能化是發(fā)展的方向,但還有一段很長的路要走?! ∧敲此阉饕媸窃鯓記Q定相關性的呢?他們依靠一套規(guī)則,主要的規(guī)則是頁面中關鍵詞出現(xiàn)的位置和頻率,我們把這稱做"位置/頻率法"。1、位置和頻率(1)、位置 如果你到圖書館去尋找有關旅游方面的書,管理員首先會去查找題目中有"旅游"的書籍。搜索引擎也一樣,關鍵詞(即"旅游")出現(xiàn)在題目(Title)中的頁面比那些Title中不出現(xiàn)關鍵詞的頁面更相關?! ∷阉饕孢€會檢查關鍵詞是否出現(xiàn)在頁面的頂部,如文章標題中或前面的幾個段落。他們認為與搜索主題相關的頁面在開始都會提到那些詞語。(2)、頻率 頻率是相關性的另外一個主要因素。搜索引擎會分析頁面中關鍵詞相對其他詞語所出現(xiàn)的頻率,頻率越高,就越具相關性。2、搜索引擎在排列網(wǎng)頁時有一定的差異 所有的搜索引擎都有以上提到的三個基本部分,在一定程度上都符合"位置/頻率法",但在具體實施上又有區(qū)別,這就是為什么我們用不同的搜索引擎做同樣的搜索時會產(chǎn)生不同結(jié)果的原因?! ∈紫?,有些搜索引擎會比其他搜索引擎索引到更多的Web頁面,有些又會比其他引擎更新索引的頻率快,所以搜索引擎索引中不可能收集完全一樣的Web頁面?! ∑浯?,出于某種原因,有些搜索引擎也可能給某些Web頁面在排列層次上有優(yōu)先權(quán)。如Excite用鏈接的流行度作為排列網(wǎng)頁的一個因素,他知道在索引中哪些頁面有許多指向他們的鏈接,他在排列時就給這些頁面小小的獎勵,將他們適當提前。這也是合理的,因為在Internet上有越多指向他們的鏈接,就說明這些頁面更被大家看重?! ×硗?,一些混合結(jié)構(gòu)(搜索引擎和目錄共存)的搜索引擎可能會把那些目錄中已存在的站點的網(wǎng)頁靠前,理由是一個站點足夠好才能放到目錄中,就應該有機會比那些不被列在目錄中的站點的網(wǎng)頁靠前?! ∽詈笠獜娬{(diào)的是,許多Web頁面設計者錯誤地認為"Meta tags"是將Web頁提到列表前列的秘密,實際上有些搜索引擎會把那些"Meta tags"中有keywords的頁面靠前,有些搜索引擎根本就不讀"Meta tags"。"Meta tags"是解決問題的一個方面,但并不是什么必需的絕密武器。四、如何提高Web頁面的相關性 搜索引擎的一次搜索會返回成百上千的相關網(wǎng)頁,一般情況下首先呈現(xiàn)出來的是10個最相關的頁面?! ∪魏握军c都想被列在前10位,因為大多數(shù)的用戶都喜歡從前10位中找到他所要的結(jié)果,排在第11位以下就意味著許多人不會訪問到你的站點?! ∠旅婢蛠砜纯慈绾文苁鼓愕木W(wǎng)頁排在列表前列。1、選擇合適的關鍵詞(Keywords) 大膽地設想別人在搜索引擎的搜索框內(nèi)正好輸入的是你頁面的Title中選擇的關鍵詞,那該多好啊!例如,如果你有一個有關郵票收藏的網(wǎng)頁,如果你想別人任何時候在搜索框里輸入"郵票收藏"時你能排在前10位,那么就為這個頁面選擇"郵票收藏"這個關鍵詞吧! 網(wǎng)站的每一個頁面都應該有反映網(wǎng)頁內(nèi)容的關鍵詞,并且關鍵詞至少由2個以上的字或詞組成。通常與單個的字或詞相關的網(wǎng)站太多太多,例如"郵票"就比"郵票收藏"所相關的網(wǎng)頁多得多,那么競爭就激烈,網(wǎng)頁排在前列的概率就相對低一些。所以不要怕花費時間,盡量選擇2個以上的字或詞組成的短語,成功的可能性會大得多?! ∽詈?,假設適當?shù)財U展文章的涉及范圍,多選幾個關鍵詞又會怎么樣呢?例如,一個郵票收藏的網(wǎng)頁可能會提到"收藏家"和"收藏",那么擴展開來,用"郵票收藏家"和"郵票收藏"增加關鍵詞的數(shù)量也是合理的??刹皇菦]有問題,因為你的網(wǎng)頁實際上是關于郵票收藏的精典網(wǎng)頁,應該出現(xiàn)在郵票收藏一類網(wǎng)頁的前列,但你在關鍵詞上擴展了頁面的涉及范圍,可能就會無意識地降低頁面對于"郵票收藏"的相關性。如何決定更好,看你的想法了!2、關鍵詞(Keywords)出現(xiàn)的位置 選擇好關鍵詞后還要確保關鍵詞出現(xiàn)在至關重要的位置。首先頁面的題目(Title)是最重要的地方,忽略將關鍵詞放進頁面的題目中是許多本身具備良好相關性的網(wǎng)頁被排在底層的原因?! ∑浯蜗袂懊嫣岬降?,搜索引擎也看中關鍵詞出現(xiàn)在頁面前面的網(wǎng)頁,所以有可能的話就把關鍵詞作為大標題,并使得關鍵詞出現(xiàn)在網(wǎng)頁的第一段?! √貏e注意的是使用表格會把網(wǎng)頁的正文推到網(wǎng)頁的更下面,就會造成相關性的降低。例如,畫一個有兩列的表格,第一列放的是對其他網(wǎng)頁的鏈接,第二列才是含有關鍵詞的正文。瀏覽看到的網(wǎng)頁是這樣的:--------------------------------------------------------------------------------主頁 郵票收藏郵票歷史 郵票收藏愛好者遍布世界各地。每天都有成郵票價格 千上萬的人在對郵票津津樂道,并且每天的郵票郵票展覽 交易額達數(shù)百萬元。點擊各個欄目,你就可以得郵票精品 到許多郵票的知識。-------------------------------------------------------------------------------- 而搜索引擎看這個頁面是這樣的:--------------------------------------------------------------------------------主頁郵票歷史郵票價格郵票精品郵票收藏 郵票收藏愛好者遍布世界各地。每天都有成千上萬的人在對郵票津津樂道,并且每天的郵票交易達數(shù)百萬元。點擊各個欄目,你就可以得到許多郵票的知識。-------------------------------------------------------------------------------- 顯然,關鍵詞"郵票收藏"移到了下面!在這種情況下,除了使用metatags外,沒有其他更好的辦法。使用metatags對那些讀metatags的搜索引擎有幫助,對其他不讀metatags的搜索引擎也不是什么大不了的問題。你認為表格對你的頁面很有影響,也沒有必要放棄他們,喜歡的話就繼續(xù)使用,不能因個別搜索引擎而破壞頁面的整體性。 大量的JavaScript也和表格有一樣的影響。搜索引擎首先讀JavaScript語句,引起正常的HTML正文排后一些。這樣,如有可能的話,把JavaScript語句放到頁面后面一點。也可以使用metatags來幫助解決問題。3、頁面有相關的內(nèi)容 如果頁面沒有相關的內(nèi)容,即使改變頁面的題目或使用metatags都不會對你在搜索引擎的位置有何幫助。就是說你使用的關鍵詞要反映頁面的內(nèi)容?! ∮行╉撁娉霈F(xiàn)的是大量的圖形,看起來非常漂亮,但搜索引擎卻不能讀這些圖形,他們就得不到文字來決定頁面的相關性。有些搜索引擎也可能將ALT包含的文字和metatags結(jié)合起來索引。但為保險起見,建議盡可能用HTML文字,訪問者也喜歡這些實質(zhì)性的東西。 另外,要保證HTML文字是可見的。有些頁面設計者想通過用微小的字體或把字體顏色設置成和背景顏色一致的方法在正文中重復關鍵詞。雖然瀏覽器是看不見了,但搜索引擎卻能識破這種類似的詭計。料想瀏覽器都看不見的東西,搜索引擎也不應該索引到它。這些頁面是搜索引擎的垃圾,應該擯棄它們。4、避免搜索引擎阻塞 有些搜索引擎看WEB頁面,就像一個人使用非常舊的版本的瀏覽器一樣。他們不能讀圖象映像(image maps),不能讀框架結(jié)構(gòu)(frames)。你必須考慮到這些問題,否則搜索引擎也許根本就不可能索引到你的任何頁面。(1)、要有HTML文字鏈接。頁面設計者經(jīng)常在主頁上只是用圖象映像來鏈接子頁面,那么不能跟隨這種鏈接的搜索引擎就不能到達站點的子頁面。最不幸的是,子頁面常常比主頁更有相關性。所以建議在主頁底部加一些在文字上所做的HTML超鏈接來鏈接各個子頁面,搜索引擎就會發(fā)現(xiàn)他們,并跟隨進去。 你也可以考慮制作一個帶有文字鏈接的本站導航頁來鏈接網(wǎng)站的所有頁面。然后遞交這個頁面,幫助搜索引擎查找站點的其他所有網(wǎng)頁。(2)、框架結(jié)構(gòu)是致命的一擊。一些主要的搜索引擎都不能跟隨框架里的鏈接。你只好使用meta tags或另外的巧妙設計來解決它。(3)、動態(tài)頁面的阻塞。有些搜索引擎也不可能索引由CGI或數(shù)據(jù)庫所生成的動態(tài)頁面,所以盡量使用靜態(tài)頁面。寧愿用數(shù)據(jù)庫來修改頁面,也不要動態(tài)生成它們。還要避免在URL上使用符號,尤其是問號"?",如( 5、使用meta tags 正如前面所提到的,metatags能幫助你解決象表格、框架等其他麻煩所帶來的問題。metatags也幫助你能在支持metatags的搜索引擎中控制你的站點描述語言。但須記住的是:metatags并不一定就能保證站點排在前列,他們并不是改變站點排列低落狀態(tài)的魔術彈。6、杜絕搜索引擎垃圾 首先要知道,垃圾并不一定被搜索引擎接受,搜索引擎可能會發(fā)現(xiàn)你的這種想把垃圾網(wǎng)頁提到前列的行為,并在列表中取締你的網(wǎng)頁。 一般來說,搜索引擎垃圾是想通過加上最流行的關鍵詞來達到排在前列的目的,這是不道德的行為。網(wǎng)頁應該以真實的內(nèi)容讓搜索引擎來決定其相關性,而不是毫無道理地憑借重復關鍵詞來擊敗其他網(wǎng)頁。是金子總會發(fā)光! 我們將搜索引擎的垃圾和垃圾郵件比較一下。沒人喜歡垃圾郵件,發(fā)送垃圾郵件的站點經(jīng)常面臨的是來自那些接受方的反擊。制造搜索引擎垃圾的站點降低了搜索引擎返回列表的質(zhì)量。隨著問題的越來越嚴重性,這些站點也會面臨和垃圾郵件所帶來的一樣的反擊。7、提交關鍵頁面 大多數(shù)的搜索引擎是從你提交過去的一個頁面開始索引站點的其他頁面的。所以最好提交最能概括站點的前面2到3個頁面?! ∫膊灰湃巫詣犹峤环粘绦虻淖詣犹峤贿^程,有些是很優(yōu)秀的。但那些舉足輕重的搜索引擎太重要了,還是人工提交比較好,以便你能看看提交有沒有何問題?! 「灰侣闊┨峤?到3個頁面。當搜索引擎在一個頁面上遇到問題時,它還可以從另一個頁面開始爬你的站點。8、定期檢查和維護你的列表位置 一旦你的頁面被搜索引擎列表,最好是每到一至兩個星期監(jiān)控一下列表,可能會有一些奇怪的事情發(fā)生:頁面消失了;鏈接不對了;。。。。。。那么重新提交你的站點吧。 當你對頁面做了重大改動的時候最好也要重新提交站點。搜索引擎本來是按固定的周期反復訪問站點的,然而一些搜索引擎很靈敏,它們知道有些站點一年只做一到兩次的改動,它們可能就不會經(jīng)常去訪問這些站點,那就發(fā)現(xiàn)不了站點的變化。在重大改動后重新提交將確保你的站點內(nèi)容是最新的。五、結(jié)束語 對于頁面設計者來說,花一些心思和精力與搜索引擎建立起良好的關系是值得的,往往稍做一些改動就可能得到很大的好處。即使沒有進入前10名,也在相關性上得到了一個改進。 同時,如自己的站點沒有運氣進入前10名,還應該考慮與排列前10名的站點進行互惠互利的鏈接。雖然他們是競爭對手,但你也會因此而得到許多意想不到的回報,你會發(fā)現(xiàn)網(wǎng)上指向自己站點的鏈接多了,這時你只要稍微注意一下關鍵詞的使用,你就可能跑到列表前列。何況鏈接也是人們找到你的站點的最好方式之一?! ∽詈笠f的是:搜索引擎是人們尋找Web站點的主要方式,但不是唯一的方式。人們也從以下的方式獲得站點,如口傳、傳統(tǒng)廣告、傳統(tǒng)媒體、新聞組、Web目錄和其他站點來的鏈接等。有時侯,這些形式比搜索引擎更有效。所以千萬不要被搜索引擎的排列位置所困擾,一個頁面設計者更多的時間應該放在制作更好的網(wǎng)頁上。。
熱心網(wǎng)友
Internet是一個巨大的信息資源寶庫,幾乎所有的Internet用戶都希望寶庫中的資源越來越豐富,使之應有盡有。的確每天都有新的主機被連接到Internet上,每天都有新的信息資源被增加到Internet中,使Internet中的信息以驚人的速度增長。然而Internet中的信息資源分散在無數(shù)臺主機之中,如果用戶想將所有主機中的信息都做一番詳盡的考察,無異于大海撈針。那么用戶如何在數(shù)百萬個網(wǎng)站中快速有效地查找到想要得到的信息呢?這就要借助于Internet中的搜索引擎。搜索引擎是Internet上的一個網(wǎng)站,它的主要任務是在Internet中主動搜索其他Web站點中的信息并對其自動索引,其索引內(nèi)容存儲在可供查詢的大型數(shù)據(jù)庫中。當用戶利用關鍵字查詢時,該網(wǎng)站會告訴用戶包含該關鍵字信息的所有網(wǎng)址,并提供通向該網(wǎng)站的鏈接。目前國內(nèi)用戶使用的搜索引擎主要有兩類:即英文引擎和中文引擎。常用的英文搜索引擎包括google、Yahoo!、MSN、Infoseek等,常用的中文搜索引擎主要有:中文google、一搜、3721、百度、中搜、搜狐搜狗、網(wǎng)易等。。