Google搜索引擎原理(2)_SEO優(yōu)化教程
推薦:網(wǎng)站的SEO并非一定需要靜態(tài)化在國內(nèi),很多SEO專家給客戶網(wǎng)站的第一診斷結(jié)果就是要頁面靜態(tài)化。這倒不是因為動態(tài)頁面就做不了SEO,而是相對靜態(tài)頁面而言,動態(tài)頁面的SEO更加難做,受SEO專家
1. 3設計目標
1.3.1提高搜索質(zhì)量我們的主要目標是提高Web搜索引擎的質(zhì)量。
1994年,有人認為建立全搜索索引(a complete search index)可以使查找任何數(shù)據(jù)都變得輕易。根據(jù)Best of the Web 1994 — Navigators ,“最好的導航服務可以使在Web上搜索任何信息都很輕易(當時所有的數(shù)據(jù)都可以被登錄)”。然而1997年的Web就迥然不同。近來搜索引擎的用戶已經(jīng)證實索引的完整性不是評價搜索質(zhì)量的唯一標準。用戶感愛好的搜索結(jié)果往往湮沒在“垃圾結(jié)果Junk result”中。實際上,到1997年11月為止,四大商業(yè)搜索引擎中只有一個能夠找到它自己(搜索自己名字時返回的前十個結(jié)果中有它自己)。導致這一問題的主要原因是文檔的索引數(shù)目增加了好幾個數(shù)量級,但是用戶能夠看的文檔數(shù)卻沒有增加。用戶仍然只希望看前面幾十個搜索結(jié)果。因此,當集合增大時,我們就需要工具使結(jié)果精確(在返回的前幾十個結(jié)果中,有關(guān)文檔的數(shù)量)。由于是從成千上萬個有點相關(guān)的文檔中選出幾十個,實際上,相關(guān)的概念就是指最好的文檔。高精確非常重要,甚至以響應(系統(tǒng)能夠返回的有關(guān)文檔的總數(shù))為代價。令人興奮的是利用超文本鏈接提供的信息有助于改進搜索和其它應用。尤其是鏈接結(jié)構(gòu)和鏈接文本,為相關(guān)性的判定和高質(zhì)量的過濾提供了大量的信息。Google既利用了鏈接結(jié)構(gòu)又用到了anchor文本(見2.1和2.2 節(jié))。
1.3.2搜索引擎的學術(shù)研究隨著時間的流逝,除了發(fā)展迅速,Web越來越商業(yè)化。
1993年,只有1.5%的Web服務是來自.com域名。到1997年,超過了60%。同時,搜索引擎從學術(shù)領(lǐng)域走進商業(yè)。到現(xiàn)在大多數(shù)搜索引擎被公司所有,很少技公開術(shù)細節(jié)。這就導致搜索引擎技術(shù)很大程度上仍然是暗箱操作,并傾向做廣告(見附錄A)。Google的主要目標是推動學術(shù)領(lǐng)域在此方面的發(fā)展,和對它的了解。另一個設計目標是給大家一個實用的系統(tǒng)。應用對我們來說非常重要,因為現(xiàn)代網(wǎng)絡系統(tǒng)中存在大量的有用數(shù)據(jù)(us because we think some of the most interesting research will involve leveraging the vast amount of usage data that is available from modern web systems)。例如,天天有幾千萬個研究。然而,得到這些數(shù)據(jù)卻非常困難,主要因為它們沒有商業(yè)價值。我們最后的設計目標是建立一個體系結(jié)構(gòu)能夠支持新的關(guān)于海量Web數(shù)據(jù)的研究。為了支持新研究,Google以壓縮的形式保存了實際所抓到的文檔。設計google的目標之一就是要建立一個環(huán)境使其他研究者能夠很快進入這個領(lǐng)域,處理海量Web數(shù)據(jù),得到滿足的結(jié)果,而通過其它方法卻很難得到結(jié)果。系統(tǒng)在短時間內(nèi)被建立起來,已經(jīng)有幾篇論文用到了 Google建的數(shù)據(jù)庫,更多的在起步中。我們的另一個目標是建立一個宇宙空間實驗室似的環(huán)境,在這里研究者甚至學生都可以對我們的海量Web數(shù)據(jù)設計或做一些實驗。
共5頁: 上一頁 1 [2] [3] [4] [5] 下一頁
分享:與搜索引擎交朋友大多數(shù)的新電子商務公司一定遲早會發(fā)現(xiàn):創(chuàng)造一個網(wǎng)站并不意味著客戶一定會參觀它。而這一發(fā)現(xiàn)過程可能是很痛苦的。雖然有數(shù)以百萬計的潛在客戶在線,但是,旨
- 相關(guān)鏈接:
- 教程說明:
SEO優(yōu)化教程-Google搜索引擎原理(2)
。