本書介紹了Python3網絡爬蟲的常見技術。
首先介紹了網頁的基礎知識,然後介紹了urllib、requests請求庫以及XPath、BeautifulSoup等解析庫,
接著介紹了selenium對動態網站的爬取和Scrapy爬蟲框架,
最後介紹了Linux的基礎,便於讀者能夠自主部署編寫好的爬蟲腳本。
本書介紹了Python3網絡爬蟲的常見技術。
首先介紹了網頁的基礎知識,然後介紹了urllib、requests請求庫以及XPath、BeautifulSoup等解析庫,
接著介紹了selenium對動態網站的爬取和Scrapy爬蟲框架,
最後介紹了Linux的基礎,便於讀者能夠自主部署編寫好的爬蟲腳本。