本書的主旨是介紹如何結合Python進行網絡爬蟲程序的開發,從Python語言的基本特性入手,詳細介紹了Python爬蟲開發的各個方面,涉及包括HTTP、HTML、JavaScript、正則表達式、自然語言處理、數據科學等不同領域的內容。全書共分為15章,包括了Python基礎知識、網站分析、網頁解析、Python文件讀寫、Python與數據庫、AJAX技術、模擬登錄、文本與數據分析、網站測試、Scrapy爬蟲框架、爬蟲性能等多個主題。內容覆蓋網絡抓取與爬蟲編程中的主要知識和技術,在重視理論基礎的前提下,從實用性和豐富度出發,結合實例演示了爬蟲編寫的核心流程。
本書適合Python語言初學者、網絡爬蟲技術愛好者、數據分析從業人士以及高等院校電腦科學、軟件工程等相關專業的師生閱讀。