【愛否SEO】SEO視頻教程-SEO優化教程-SEO教程自學網:306090669(QQ)
4008883171

【愛否SEO】 > SEO教程 > 百度SEO教程 >

百度搜索引擎原理簡單分析圖

編輯:【愛否SEO】發布時間: 2017-11-28
先上圖來簡單看下搜索引擎的三板斧:數據搜集預處理【索引】排名。 數據搜集 即數據的搜集階段,將網頁從浩如瀚海的互聯網世界搜集到自己的數據庫中進行存儲。 1、抓取維護策略 面對大量需要處理的數據,很多問題需要事先考慮好。比如是即時抓取數據還是事先抓取?在對數據進行維護時是定期抓...

先上圖來簡單看下搜索引擎的“三板斧”:數據搜集—>預處理【索引】—>排名。

  1.jpg

  數據搜集

  即數據的搜集階段,將網頁從浩如瀚海的互聯網世界搜集到自己的數據庫中進行存儲。

  1、抓取維護策略

  面對大量需要處理的數據,很多問題需要事先考慮好。比如是“即時抓取”數據還是“事先抓取”?在對數據進行維護時是“定期抓取”(定期一次深度大抓取,替代原有的數據)還是“增量抓取”(以原有數據為根基,進行新舊交替)?

  2、鏈接跟蹤

  我們都知道,蜘蛛是順著鏈接爬行和抓取頁面的。如何快速抓取到對用戶來說相對重要的信息以及達到廣闊的覆蓋無疑是搜索引擎需要重點考慮的問題。

  先來說第一個,怎么抓取到重要的信息。

  想要知道這個,首頁要明白人們是怎么樣主觀去判斷一個頁面是否重要的(自己先思考下)。其實無外乎以下幾種情況:

  網頁有歷史權重積累(域名等時間較長、質量高、資格老)、很多人會提到這個頁面(外鏈指向)、很多人會引用這個頁面(轉載或者鏡像)、這個頁面便于用戶快速瀏覽(層級較淺)、經常有新的內容出現(更新)等等。

  而在鏈接跟蹤階段,其實能得到的信息只有“這個頁面便于用戶快速瀏覽(層級較淺)”,其它信息還未獲取。

  對于信息的覆蓋,其實就是蜘蛛在跟蹤鏈接時的兩個策略:深度抓取與廣度抓取。

  1.jpg

  用屁股想一下也知道,廣度抓取有助于獲取到更多的信息,深度抓取有助于得到更全面的信息。搜索引擎蜘蛛在抓取數據時,通常會兩種方式都采用,但是相比較來說,廣度抓取要多于深度抓取。

  3、地址庫

  搜索引擎在建立初期,必須是要有一個人工錄入的種子庫的,否則蜘蛛將會在進行連接跟蹤時無從下手。順著這些種子庫,蜘蛛可以發現更多的鏈接。

  當然,多個搜索引擎都會放出一個頁面的提交入口,以便于站長將站點進行提交。

  不過值得一提的是,搜索引擎更喜歡自己發現的鏈接。

站內導航
 
QQ在線咨詢
售前咨詢熱線
4008883171
售后咨詢熱線
13622373171
急速赛车规律怎么找 北京快3走势图今天 香港麻将馆规则 金牛策略 上海快上海快3 在线理财平台亠乾贷网 山西快乐十分派彩电子图 温州麻将的基本规则 贵州微乐麻将下载 四川麻将定缺算牌技巧 杭州麻将技巧图解 福州同城麻将 掌中宝配资 河南11选5走势图 黄金股票有哪些 河北快三开奖 优先股试点