網絡爬蟲是當今獲取數據不可或缺的重要手段。本書講解了Python爬蟲的進階理論與技術,幫助讀者提升實戰水平。
全書共7章。第1~3章為常見反爬機制的應對手段,主要內容包括Cookie模擬登錄、多種類型的驗證碼
識別、Ajax動態請求破解。第4章為手機App內容爬取。第5章和第6章為Scrapy爬蟲框架應用。第7章為爬蟲雲服務器部署。
本書適合有一定Python網絡爬蟲編程基礎的學生或相關從業人員,以及想要在Python網絡爬蟲開發、不同類型的反爬機制應對、爬蟲框架開發、爬蟲雲端部署等方面進階提高的讀者。