在優化之前,首先,我們需要知道Google的搜索引擎的原則,這對于優化站點是至關重要的。 步驟1:蜘蛛捕捉和收集 這個網站是一個獨立的存在,當一個新的網站建立起來的時候,搜索引擎將無法知道它的存在,除非谷歌派蜘蛛去抓取它。蜘蛛是一個谷歌重要的獲取技術,網站收集的來源,和源代碼相當于其網絡,讓它爬在任何web頁面的源代碼,源代碼中,另一個新鏈接,它將繼續抓住,穿梭在一個單獨的頁面爬行,爬行爬……實現web頁面包含的目的。 問題是如何吸引蜘蛛爬蟲進入4個主要的點: 1。頁面更新頻率 谷歌喜歡抓住新事物。新詹的蜘蛛爬行頻率更高,但如果你不經常去更新,當蜘蛛反復發現沒有新的信息可以爬行時,那么慢慢地就會減少訪問頻率,從1個月到幾個月。 當爬行器不抓取web頁面的源代碼時,來自web頁面的新信息不會出現在搜索引擎中。因此,建議新站應在第一個月和第二個月之間頻繁更新信息。 2。導入鏈接 那么,蜘蛛關注的是什么平臺呢?像Facebook、twitter、阿里巴巴和維基百科這樣的大型平臺經常被蜘蛛光顧,這就要求我們在這些平臺上發布鏈接,增加蜘蛛的進口。 3。點擊主頁的距離 蜘蛛是第一個訪問該網站主頁的網站,該網站包含許多頁面。國際站平臺,例如,一個平臺在1000產品,上傳后,從第一頁開始點擊跳轉需要訪問的200產品詳細信息頁面,然后細節頁面離家很遙遠,因為點擊跳轉的數量太繁瑣,蜘蛛也懶抓取,尤其是新網站權重不高。 4。網站和頁面重 網站是需要保存的,需要經過一段時間的降水數據,網站的重量越高,蜘蛛的捕捉頻率就越高,對于新網站來說,建議至少3個月到半年的時間。 步驟2:過濾頁面的預處理 蜘蛛每天能捕捉到非常非常多的頁面,但是有那么多的頁面是Google無法保存的。Google還將通過它的預處理來調用索引機制,并選擇爬行器獲取到源數據的核心關鍵字信息。那么谷歌是如何選擇的呢? 1。中提取文本 爬行頁面包含大量源代碼,首先處理的是文本信息在代碼中提取,包括元標記替代文本、鏈接、錨文本、圖像、文本、文本。 2。停止這個詞 提取的文本將包含很多信息,例如,,,的話說,這些話就像我們中國人啊感嘆詞,頻率非常高,但它不會是內容的主要意義,這些詞被稱為停止的話,也可以過濾掉。 3。消除噪聲 在頁眉,頁腳,導航,文本將存在大量重復的內容,幾乎所有的內容都有相同的源代碼,Google將刪除重復的內容,只留下不重復的部分。 4。重復的頁面 當我們在做B2B平臺時,我們傾向于用一些關鍵字覆蓋一個產品,而產品的細節是一樣的。但這種方法不適用于Google,因為當用戶搜索瀏覽前幾頁內容時,會多次看到相同的內容,因為用戶體驗將非常糟糕,Google不會重復其中的內容。 從這些過程中,谷歌可以告訴你網站的質量。 |