您現在的位置:[辽宁35选7]辽宁35选7 > 搜索引擎基本工作原理

辽宁35选7:搜索引擎基本工作原理

發布日期:2014-02-17 閱讀次數:1692

有的同學做了很久的seo的工作,但是對于搜索引擎工作原理還是一知半解,正所謂知己知彼,方能百戰不殆,反之我們就會在這條道路上走得很艱難,那么搜索引擎工作原理是什么呢?下面辽宁35选7小編就來詳細了解一下。

首先:建立索引

一、 百度分詞
百度因為是中文搜索引擎從在中國的用戶是最多的,它擁有強大的分析技術。一個字段可以拆分出許多的關鍵詞,如同英文單詞一樣,拆分出來的詞我們叫做單詞。

二、 為什么要進行分詞
中國的文字語言歷史悠久,漢字多達9萬左右,而常用的漢字也有4000左右,這些常用的漢字不用數量及規則進行隨意組合,其結果已經達到天文數字,對于搜索引擎來說是不能很好的處理這些文字的。如果我們按相鄰的詞出現的頻率來統計,就可以把這4000個常用漢字組合成8萬左右個單字,雖然比單個漢字多了很多,但是易于搜索引擎的匹配。用戶搜索詞如果拆分為單詞要明顯比拆分為單字的數量少,如果是文檔的話,拆分成單詞也比單字數量要少的多。這樣搜索引擎只要擁有一個詞庫就可以完全處理用戶的搜索。

三、 分詞方法
搜索引擎是沒有眼睛的,百度分詞的具體實現辦法是比較復雜的,但是原理還是比較簡單的,有以下這三種分詞的方法:

1、正向最大化匹配-從左向右拆分

2、反向最大化匹配-從右向左反向分詞

3、雙向最大化匹配-左右同時進行分詞

四、 案例的分析
這里我們簡單的講到了百度分詞方法,是讓同學們了解百度會對文檔和字段進行切分,避免大家在優化中出現關鍵詞的堆積和重復;例如:留學_美國留學_留學費用_美國哈弗留學-品牌詞_這個表示詞段切分。

以上我們明顯可以看到留學和美國留學這兩個詞,可以通過美國哈弗留學這個詞進行拆分就能得到,所以注意這些關鍵詞的堆砌。

最后:輸出結果

用戶在輸入需要搜索的詞后,百度會進行一系列復雜的分析,根據最終的結論在索引庫中尋找與之最為匹配的網頁,按照用戶輸入關鍵詞所體現的需求及網頁的優劣進行打分評估,并按照最終的分數進行排列,展現出結果。

百度的查詢系統是直接面向客戶的系統,響應用戶的搜索,返回搜索結果。

并不是所有包含搜索詞的已經被收錄的頁面都要進行一次相似度計算,特別的對于一些熱門的搜索詞,這個是非常費勁的;同時,搜索引擎是可以按照頁面的鏈接權重來進行篩選,忽略掉鏈接權重值比較低的頁面,優先鏈接權重值比較高的頁面。

總結:從蜘蛛的爬取到輸出搜索結果,期中經歷一系列復雜的算法,SEO必須遵守百度分詞的方法,合理控制我們網站的關鍵詞布局,從而讓搜索引擎更快、更好的來抓取我們的網頁。

標簽:搜索引擎
司瓦圖胡經理
技術客服,免費咨詢
技術客服司瓦圖胡經理
司瓦圖網絡自2007年正式注冊成立,目前提供各類平臺系統定制,包括電商平臺開發,微信小程序定制開發,微信平臺定制開發,企業官網制作以及400電話開通等服務!

全國服務熱線4000-522-555周一至周六8:30-18:00

地址:合肥市政務區天瓏廣場5號甲級寫字樓1007-1008室

老張個人微信

老張原創分享

Copyright © 2018 版權所有:合肥司瓦圖網絡科技有限責任公司 ALL Rights Reserved  
皖ICP備07007410號
司瓦圖老張頭像
司瓦圖老張
老張自05年進入互聯網行業,一直從事互聯網平臺開發行業,服務項目主要有:平臺定制開發,電商平臺開發,微信商城,微信小程序等。
司瓦圖老張微信
{ganrao}