最後排名調整

首先,目前360搜索的結果質量相當高,越是常用詞,搜索質量越高,長尾詞則質量下降。如果確如360自己所言,360搜索是他們自己的技術,那相當不容易。要知道,搜索引擎是個需要積累的、高技術含量的東西。這裡說的積累,不僅是人才(這個倒可以短時間解決),還有算法的修改評測和數據的累積。尤其是數據的累積,這個幾乎無法短時間彌補。如果360搜索在沒有歷史數據累積的情況下達到目前水平,那是相當驚人地牛X的。看看百度、Google之外的其它搜索引擎的質量就知道這有多難了,包括Bing,以微軟在人才、資金上的投入,又做了那麼多年的搜索,到現在也沒怎麼樣。 不過呢,360搜索是否真的是他們自己的技術,我有高度疑問。除了上面說的難度問題,還有一些對排名結果的觀察。根據我關注的一部分關鍵詞的排名對比和歷史記錄數據,360搜索的結果很像百度結果最後排名調整前的數據,而且是一段時間以前的。 這裡可能需要說明一下“最後排名調整”指的是什麼。搜索引擎收到查詢詞,在數據庫中按正常算法找到應該排前1000名(Google)或前760名(百度)的URL後,並不是馬上直接顯示出來,而是要在這1000個或760個結果中再最後調整一下排名,包括某些過濾算法的加入、這些URL之間鏈接關係的再計算等等。所以,我們有時候會在百度第76頁看到一些很熟悉的、曾經風光過、現在被某種形式懲罰的網站。也不一定總是第76頁,經常也出現在最後幾頁,比如seowhy.com的首頁現在就在第75頁。這些網站既然被降權或懲罰了,乾脆找不到不是更合適嘛?為什麼放到第76頁去?原因很可能就是這是返回結果之後再最後調整的結果。 這種水平的高度相似,如果解釋為巧合,或排名算法的相似,我比較難以相信。在數據量很大的情況下,算法的任何微小差異都將導致結果的明顯差別。