百度與谷歌搜索引擎【檢索功能】的異同點

企業動態技術分享行業動態

百度與谷歌搜索引擎【檢索功能】的異同點

2023-04-20 模板建站

一個搜索引擎的算法，有很多的方面。主要是“域名、密度、相關度、服務器穩定、內鏈、外鏈、內容更新、域名時間、內容數量”這些方面。這些都是搜索引起算法最核心的部分。說白了也就是你做關鍵詞，給網站做優化需要注意的問題。只有做競爭很大網站優化的時候，才會考慮這么多要素。經常看到一些 “seo高手”說，我沒有優化，這個詞就做到了第一位，或我網站名稱一直在第一名等。那些都是沒有什么競爭的詞，這個時候，你只需要考慮密度即可。遇到那些競爭激烈的詞，你就要注意更多的因素了，也就是那些牛人常說的，要主意細節問題。說這話的，基本都是技術有兩下的。　　然而這么要素，在三大搜索引擎中的權重又各不相同。例如百度非常看重密度，雅虎看重玉米的時間，google很看重外鏈和外鏈的穩定。他們都有自己的算法側重點，想要在三大搜索引擎中獲得好的排名，就都要考慮。　　關于robots文件，百度完全不搭理這個東西。而google卻非常看重。還有404和500錯誤。這些東西百度是從來不管的，而google是相當重視的，重視到你可怕的程度. 　　給公司做的網站，前段時間突然google的收錄為零了。不是一個站，是大部分站點。當時找不到原因，我以為是幾個網站內容重復性太高，而且共用一個模板照成的。當我的一個同事給這些網站做google地圖的時候發現，無法驗證那個文件。讓服務器管理員找原因也沒有找到，后來還是這位同事細心，發現了網站出現500錯誤。本應該是404的錯誤，卻出現了500，就因為這一個原因，google就拒絕了收錄，而且清空了數據。解決這個問題后，第二天google就重新收錄了。　　當時我就一個感慨，google真夠變態的。做優化，必須要注重細節問題，不要以為自己很牛B了，其實還有很多問題你沒有發現。什么是高手?高手就是可以解決難題的人。　　其實google只是細節方面注意太多，最變態的莫過于雅虎了。難道是因為雅虎做搜索最早的緣故?雅虎對于作弊站點，毫不留情，與百度不相上下。　　對于K掉IP，基本上搜索引擎很少去做。尤其是百度很少這樣做，他會K掉大部分，而保留小部分站點，IP是很少封的。因為百度知道，國內還是虛擬主機的天下。然而老外IP多，服務器也多，國外的空間都是送IP的，所以雅虎看到你作弊，就會毫不留情的K掉你的IP。IP下的站點，就是不收錄你，那怕你和那個作弊的站點沒有任何關系。　　從這些細節方面，我們就可以看出他們為什么會那樣做了。國情不同啊，想要本地化，不和百度學真的不行。雖然百度經常很無恥的K掉你，而不給你贖罪的機會。概念】搜索引擎(search engine)是指根據一定的策略、運用特定的計算機程序搜集互聯網上的信息，在對信息進行組織和處理后，并將處理后的信息顯示給用戶，是為用戶提供檢索服務的系統。　　從使用者的角度看，搜索引擎提供一個包含搜索框的頁面，在搜索框輸入詞語，通過瀏覽器提交給搜索引擎后，搜索引擎就會返回跟用戶輸入的內容相關的信息列表。　　互聯網發展早期，以雅虎為代表的網站分類目錄查詢非常流行。網站分類目錄由人工整理維護，精選互聯網上的優秀網站，并簡要描述，分類放置到不同目錄下。用戶查詢時，通過一層層的點擊來查找自己想找的網站。也有人把這種基于目錄的檢索服務網站稱為搜索引擎，但從嚴格意義上講，它并不是搜索引擎。【分類】　　1、全文索引　　全文搜索引擎是名副其實的搜索引擎，國外代表有Google，國內則有著名的百度搜索。它們從互聯網提取各個網站的信息（以網頁文字為主），建立起數據庫，并能檢索與用戶查詢條件相匹配的記錄，按一定的排列順序返回結果。　　根據搜索結果來源的不同，全文搜索引擎可分為兩類，一類擁有自己的檢索程序（Indexer），俗稱“蜘蛛”（Spider）程序或“機器人”（Robot）程序，能自建網頁數據庫，搜索結果直接從自身的數據庫中調用，上面提到的Google和百度就屬于此類；另一類則是租用其他搜索引擎的數據庫，并按自定的格式排列搜索結果，如Lycos搜索引擎。　　2、目錄索引　　目錄索引雖然有搜索功能，但嚴格意義上不能稱為真正的搜索引擎，只是按目錄分類的網站鏈接列表而已。用戶完全可以按照分類目錄找到所需要的信息，不依靠關鍵詞（Keywords）進行查詢。目錄索引中最具代表性的莫過于大名鼎鼎的Yahoo、新浪分類目錄搜索。　　3、元搜索引擎　　元搜索引擎（META Search Engine）接受用戶查詢請求后，同時在多個搜索引擎上搜索，并將結果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、 Vivisimo等，中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索結果排列方面，有的直接按來源排列搜索結果，如Dogpile；有的則按自定的規則將結果重新排列組合，如Vivisimo。　　其他非主流搜索引擎形式：　　1、集合式搜索引擎：該搜索引擎類似元搜索引擎，區別在于它并非同時調用多個搜索引擎進行搜索，而是由用戶從提供的若干搜索引擎中選擇，如HotBot在2002年底推出的搜索引擎。　　2、門戶搜索引擎：AOL Search、MSN Search等雖然提供搜索服務，但自身既沒有分類目錄也沒有網頁數據庫，其搜索結果完全來自其他搜索引擎。　　3、免費鏈接列表（Free For All Links簡稱FFA）：一般只簡單地滾動鏈接條目，少部分有簡單的分類目錄，不過規模要比Yahoo！等目錄索引小很多。【工作原理】　　1、抓取網頁　　每個獨立的搜索引擎都有自己的網頁抓取程序（spider）。Spider順著網頁中的超鏈接，連續地抓取網頁。被抓取的網頁被稱之為網頁快照。由于互聯網中超鏈接的應用很普遍，理論上，從一定范圍的網頁出發，就能搜集到絕大多數的網頁。　　2、處理網頁　　搜索引擎抓到網頁后，還要做大量的預處理工作，才能提供檢索服務。其中，最重要的就是提取關鍵詞，建立索引文件。其他還包括去除重復網頁、分析超鏈接、計算網頁的重要度。　　3、提供檢索服務　　用戶輸入關鍵詞進行檢索，搜索引擎從索引數據庫中找到匹配該關鍵詞的網頁；為了用戶便于判斷，除了網頁標題和URL外，還會提供一段來自網頁的摘要以及其他信息。【全文搜索引擎】　　在搜索引擎分類部分我們提到過全文搜索引擎從網站提取信息建立網頁數據庫的概念。搜索引擎的自動信息搜集功能分兩種。一種是定期搜索，即每隔一段時間（比如Google一般是28天），搜索引擎主動派出“蜘蛛”程序，對一定IP地址范圍內的互聯網站進行檢索，一旦發現新的網站，它會自動提取網站的信息和網址加入自己的數據庫。　　另一種是提交網站搜索，即網站擁有者主動向搜索引擎提交網址，它在一定時間內（2天到數月不等）定向向你的網站派出“蜘蛛”程序，掃描你的網站并將有關信息存入數據庫，以備用戶查詢。由于近年來搜索引擎索引規則發生了很大變化，主動提交網址并不保證你的網站能進入搜索引擎數據庫，因此目前最好的辦法是多獲得一些外部鏈接，讓搜索引擎有更多機會找到你并自動將你的網站收錄。　　當用戶以關鍵詞查找信息時，搜索引擎會在數據庫中進行搜尋，如果找到與用戶要求內容相符的網站，便采用特殊的算法——通常根據網頁中關鍵詞的匹配程度，出現的位置/頻次，鏈接質量等——計算出各網頁的相關度及排名等級，然后根據關聯度高低，按順序將這些網頁鏈接返回給用戶。【目錄索引】　　與全文搜索引擎相比，目錄索引有許多不同之處。　　首先，搜索引擎屬于自動網站檢索，而目錄索引則完全依賴手工操作。用戶提交網站后，目錄編輯人員會親自瀏覽你的網站，然后根據一套自定的評判標準甚至編輯人員的主觀印象，決定是否接納你的網站。　　其次，搜索引擎收錄網站時，只要網站本身沒有違反有關的規則，一般都能登錄成功。而目錄索引對網站的要求則高得多，有時即使登錄多次也不一定成功。尤其象Yahoo!這樣的超級索引，登錄更是困難。　　此外，在登錄搜索引擎時，我們一般不用考慮網站的分類問題，而登錄目錄索引時則必須將網站放在一個最合適的目錄（Directory）。　　最后，搜索引擎中各網站的有關信息都是從用戶網頁中自動提取的，所以用戶的角度看，我們擁有更多的自主權；而目錄索引則要求必須手工另外填寫網站信息，而且還有各種各樣的限制。更有甚者，如果工作人員認為你提交網站的目錄、網站信息不合適，他可以隨時對其進行調整，當然事先是不會和你商量的。　　目錄索引，顧名思義就是將網站分門別類地存放在相應的目錄中，因此用戶在查詢信息時，可選擇關鍵詞搜索，也可按分類目錄逐層查找。如以關鍵詞搜索，返回的結果跟搜索引擎一樣，也是根據信息關聯程度排列網站，只不過其中人為因素要多一些。如果按分層目錄查找，某一目錄中網站的排名則是由標題字母的先后順序決定（也有例外）。　　目前，搜索引擎與目錄索引有相互融合滲透的趨勢。原來一些純粹的全文搜索引擎現在也提供目錄搜索，如Google就借用Open Directory目錄提供分類查詢。而象 Yahoo! 這些老牌目錄索引則通過與Google等搜索引擎合作擴大搜索范圍（注）。在默認搜索模式下，一些目錄類搜索引擎首先返回的是自己目錄中匹配的網站，如國內搜狐、新浪、網易等；而另外一些則默認的是網頁搜索，如Yahoo。【搜索引擎的發展史】　　1990年，加拿大麥吉爾大學（University of McGill）計算機學院的師生開發出Archie。當時，萬維網（World Wide Web）還沒有出現，人們通過FTP來共享交流資源。Archie能定期搜集并分析FTP服務器上的文件名信息，提供查找分別在各個FTP主機中的文件。用戶必須輸入精確的文件名進行搜索，Archie告訴用戶哪個FTP服務器能下載該文件。雖然Archie搜集的信息資源不是網頁（HTML文件），但和搜索引擎的基本工作方式是一樣的：自動搜集信息資源、建立索引、提供檢索服務。所以，Archie被公認為現代搜索引擎的鼻祖。　　搜索引擎的起源: 　　所有搜索引擎的祖先，是1990年由Montreal的McGill University三名學生（Alan Emtage、Peter Deutsch、Bill Wheelan）發明的Archie（Archie FAQ）。Alan Emtage等想到了開發一個可以用文件名查找文件的系統，于是便有了Archie。Archie是第一個自動索引互聯網上匿名FTP網站文件的程序，但它還不是真正的搜索引擎。Archie是一個可搜索的FTP文件名列表，用戶必須輸入精確的文件名搜索，然后Archie會告訴用戶哪一個FTP地址可以下載該文件。由于Archie深受歡迎，受其啟發，Nevada System Computing Services大學于1993年開發了一個Gopher（Gopher FAQ）搜索工具Veronica（Veronica FAQ）。Jughead是后來另一個Gopher搜索工具。

培戀網原創版權，網站建設提供網站代運營、模板網站制作轉載請注明出處,本文地址：http://www.gdszrq.com/news/media/56696.html