python爬蟲時,python 爬蟲時,urllib2 HTTPError HTTP Error 502 Bad Gateway是什麼原因?怎麼解決?

2021-04-24 10:17:53 字數 2706 閱讀 2653

1樓:匿名使用者

可能bai是那個**阻du止了這類的訪問,只要zhi在請求中加上偽裝成

dao瀏覽器專的header就可以了,屬比如:

2樓:老衲來自武當山

請求頭改為https就行

python爬蟲 如何解決http error 503問題

3樓:尐二瓜

這個有主bai要有兩種可du能:

你生成的url不正確,這zhi個你可以打dao印一下,找一個報503的url直接在url裡訪專

問,看屬看是否有問題。

亞馬遜判斷出你是爬蟲,給禁止返回資料了,這個就需要偽裝一下你的爬蟲,比如修改爬取間隔,隨機使用http header,或者使用**ip。

如果解決了您的問題請採納!

如果未解決請繼續追問

4樓:匿名使用者

從表面上bai看,python爬蟲程式

執行du中出現503錯誤是服

zhi務器的問題,其dao

實真正的原因在程式,

專由於python指令碼運屬行過程中讀取的速度太快,明顯是自動讀取而不是人工查詢讀取,這時伺服器為了節省資源就會給python指令碼反饋回503錯誤。其實只要把爬取的速度放慢一點就好了。比如讀取一條記錄或幾條記錄後適當新增上time.

sleep(10),這樣就基本上不會出現503錯誤了。我本人在使用中一般是在每一次讀取後都執行time.sleep(1)或time.

sleep(3),具體的數值根據不同的**確定。

5樓:匿名使用者

自己做個

**伺服器。例如618爬蟲**,再指向次一級**。或者是直接讓爬專蟲通過http proxy的引數設定去先把一個屬**。

**池通常是租來的,或者是掃描出來的。掃描出來的往往大部分都不可用。 爬蟲的實現有幾百種方案。

通常建議直接從scrapy入手。

6樓:穩住別慌等等我

503可能是你的請求頭有問題,不要問我為什麼,我不知道原理,但是我遇見過錯誤,重寫請求頭

7樓:匿名使用者

503表示伺服器端出現錯誤,和你的**無關;也有可能你爬取得 路徑本身有問題

python網路爬蟲可以幹啥

8樓:匿名使用者

爬蟲可以抓取網路上的資料啊。爬蟲可以用很多種程式語言實現,python只是一種。所以你想知道的是網路爬蟲可以幹什麼。

他比如**交易資料,天氣資料,**使用者資料,**。

拿到這些資料之後你就可以做下一步工作了。

你去看看這裡就明白了

9樓:匿名使用者

網路爬蟲可以抓取網上的資料,也就是通過程式去獲取web頁面上自己想要的資料。夢蝶資料對餓了麼,美團,**都可以採集抓取資料。

10樓:大梁

從**某一個頁面(通常是首頁)開始,讀取網頁的內容,找到在網頁中的其它連結地址,然後通過這些連結地址尋找下一個網頁,這樣一直迴圈下去,直到把這個**所有的網頁都抓取完為止。如果把整個網際網路當成一個**,那麼網路蜘蛛就可以用這個原理把網際網路上所有的網頁都抓取下來。

網路爬蟲(又被稱為網頁蜘蛛,網路機器人,在foaf社群中間,更經常的稱為網頁追逐者),是一種按照一定的規則,自動的抓取全球資訊網資訊的程式或者指令碼。另外一些不常使用的名字還有螞蟻,自動索引,模擬程式或者蠕蟲。

11樓:30786追風

可以看下www.akppx.com

12樓:匿名使用者

以下內容,引用自知乎資料

工程師何明科。我覺得他說得很詳盡,一點都不空泛~

1、知乎:抓取並彙總所有的答案,方便大家閱讀,找出2023年最熱門和最衰落的行業。

2、汽車之家大資料畫像:利用論壇發言的抓取以及nlp,對各種車型的車主做畫像。

4、58同城的房產、安居客、q房網、搜房等房產**:抓取房產買賣及租售資訊,對熱熱鬧鬧的房價問題進行分析。

5、大眾點評、美團網等餐飲及消費類**:抓取各種店面的開業情況以及使用者消費和評價,瞭解周邊變化的口味,所謂是「舌尖上的爬蟲」。以及各種變化的口味,比如:

啤酒在衰退,重慶小面在崛起。

6、58同城等分類資訊**:抓取招商加盟的資料,對定價進行分析,幫助網友解惑。

7、拉勾網、中華英才網等招聘**:抓取各類職位資訊,分析最熱門的職位以及薪水。

8、**網等醫療資訊**:抓取醫生資訊並於巨集觀情況進行交叉對比。

10、攜程、去哪兒及12306等交通出行類**:對航班及高鐵等資訊進行抓取,能從一個側面反映經濟是否正在走入下行通道。

12、58同城二手車、易車等汽車類**:找出最佳的買車時間以及最保值的汽車。

13、神州租車、一嗨租車等租車類**:抓取它們列舉出來的租車資訊,長期跟蹤租車**及數量等資訊。

14、各類信託**:通過抓取信託的資料,瞭解信託專案的型別及規模。

想獲取更多it類資料,可以到優就業官網看哦~

學習Python爬蟲需要注意哪些問題

現在之所以有這麼多的小夥伴熱衷於爬蟲技術,無外乎是因為爬蟲可以幫我們做很多事情,比如搜尋引擎 採集資料 廣告過濾等,以python為例,python爬蟲可以用於資料分析,在資料抓取方面發揮巨大的作用。但是這並不意味著單純掌握一門python語言,就對爬蟲技術觸類旁通,要學習的知識和規範還有喜很多,包...

python爬蟲什麼教程最好,誰的Python教程最好

現在之所以有這麼多的小夥伴熱衷於爬蟲技術,無外乎是因為爬蟲可以幫我們做很多事情,比如搜尋引擎 採集資料 廣告過濾等,以python為例,python爬蟲可以用於資料分析,在資料抓取方面發揮巨大的作用。但是這並不意味著單純掌握一門python語言,就對爬蟲技術觸類旁通,要學習的知識和規範還有喜很多,包...

python爬蟲怎麼賺錢知乎,知乎python爬蟲如何入門學習

爬到有價值的資料,進行建模,挖掘就會產生商業價值 知乎python 爬蟲如何入門學習 入門 是良好的動機,但是可能作用緩慢。如果你手 裡或者腦子裡有一個專案,那麼實踐起來你會被目標驅動,而不會像學習模組一樣慢慢學習。另外如果說知識體系裡的每一個知識點是圖裡的點,依賴關係是邊的話,那麼這個圖一定不是一...