檢查URL被谷歌使用Python索引

2016-08-15    分類: 網站建設

如何檢查URL被谷歌使用Python索引
谷歌搜索控制臺可以幫助你確定你的網站被索引的網頁,但如何識別那些不?專欄作家Paul Shapiro有一個Python腳本就是這樣的。

有三個主要的組件有機搜索:爬行、索引和排名。當谷歌等搜索引擎來到你的網站,它抓取所有的鏈接發(fā)現。它所找到的信息然后進入搜索引擎的索引,其中不同的因素來確定哪些網頁抓取,以什么樣的順序,對于一個特定的搜索查詢。

作為SEO,我們會以我們的努力集中于排名的成分,但如果能夠抓取和索引你的站點上的網頁搜索引擎不會的,你不會收到來自谷歌的任何交通。顯然,確保您的網站是正確的抓取和索引搜索引擎是搜索引擎的重要組成部分。

但是你怎么能說如果你的網站收錄正常嗎?
如果你有機會到谷歌搜索控制臺,它告訴你多少頁都包含在你的XML網站地圖,其中有多少是索引。不幸的是,它不會走得太遠,告訴你哪些頁面是>沒有索引。

檢查URL被谷歌使用Python索引

確定一個URL已經被谷歌索引

為了確定個體的URL已經被谷歌索引,我們可以用“信息:“搜索算子,像這樣:

信息:http://searchengineland.com/google-downplays-google-algorithm-ranking-update-week-normal-fluctuations-258923

如果URL索引,結果將顯示該URL:
判斷一個網頁是谷歌索引信息算子

然而,如果URL不收錄,谷歌將返回一個錯誤,說沒有,URL信息:
谷歌的結果如果頁面沒有被索引
用python的URL批量檢查指標狀況

現在我們知道如何檢查,如果一個URL被索引,你可能想知道你如何能做這樣的集體。你可以有1000個工人檢查每一個-或者,如果你喜歡,你可以用我的Python解:

使用以上的Python腳本,確保你有Python 3安裝.你也將安裝beautifulsoup圖書館。要做到這一點,打開一個終端或命令提示符并執(zhí)行:

pip安裝beautifulsoup4

然后你可以下載到你的電腦上的腳本。在同一文件夾中的腳本,創(chuàng)建一個URL列表的文本文件,列出每個URL在單獨一行。
Python腳本文件的目錄結構

現在,你的劇本是現成的,我們需要建立Tor運行作為我們的免費代理。在Windows中,下載Tor專家束。解壓zip文件夾到本地目錄并運行tor.exe。隨時最小化窗口。
Tor專家截圖

接下來,我們需要安裝Polipo運行Tor和HTTP代理。下載最新的Windows二進制(它將被命名為“polipo-1。x.x.x-win32 .zip”)和解壓到一個文件夾。

在你Polipo文件夾,創(chuàng)建一個文本文件(例如:配置.txt)具有下列內容:

socksparentproxy =“本地:9050”
socksproxytype = SOCKS5
diskcacheroot =“”
disablelocalinterface =真

打開命令提示符并瀏覽到您Polipo目錄。

運行以下命令:

polipo.exe C config.txt
運行Tor配置Polipo

在這一點上,我們已經準備好運行實際的Python腳本:

Python indexchecker.py
Python腳本配置

該腳本將提示您指定要檢查每個URL之間等待的秒數。

它也會提示你輸入一個文件名(不帶擴展名的文件)將結果輸出到CSV。

最后,它會要求包含檢查URL的列表的文本文件的文件名。

輸入此信息,讓腳本運行。

最終的結果將是一個CSV文件,可以很容易地打開Excel,指定如果索引頁是還是不是。
ouputted CSV顯示URL索引或不

如果在腳本似乎不工作,谷歌有可能堵塞器。隨時在這種情況下,使用你自己的代理服務,通過修改后的劇本:

代理= {
“https”:“https:/ /本地:8123,
“https”:“HTTP:/ /本地:8123
}

結論
知道哪些頁面被谷歌索引是SEO成功的關鍵。你不能如果你的網頁不在谷歌的數據庫從谷歌獲得的流量!
不幸的是,谷歌不容易確定一個網站的URL索引。但有點苦勞和以上的Python腳本,我們能夠解決這個問題。

影響排名的四大因素
一份不錯的網絡營銷經驗

檢查URL被谷歌使用Python索引

網站名稱:檢查URL被谷歌使用Python索引
當前地址:http://www.muchs.cn/news36/20886.html

成都網站建設公司_創(chuàng)新互聯,為您提供標簽優(yōu)化、關鍵詞優(yōu)化、網站改版、企業(yè)網站制作全網營銷推廣、網站設計

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

網站優(yōu)化排名