本書主要介紹大數據關鍵技術中的大數據採集和數據預處理技術,是大數據專業的入門級的專業基礎課教程(含教學課件、源代碼與視頻教程),旨在為學生搭建起大數據的知識架構,講述大數據採集和數據預處理的基本原理,開展相關的實驗,為學生在大數據以及相關領域的學習奠定堅實的基礎。全書共分四部分:第一部分是理論基礎(第1~2章和第6章),主要介紹大數據技術、大數據採集和大數據預處理的基本概念以及基礎理論;第二部分是大數據採集(第3~5章),分別介紹3種大數據的採集方法、技術及4種工具;第三部分是大數據預處理(第7~8章),介紹4種大數據預處理技術、方法;第四部分是實驗指導(第9~11章),介紹大數據採集和大數據預處理的實驗平臺以及具體實驗的內容、方法、流程等。 為便於讀者高效學習,快速掌握大數據專業基礎知識。作者精心製作了完整的教學課件(11章PPT)與部分配套視頻教程(200分鐘)。本書可以作為高等院校電腦、電子信息、信息管理、軟件工程等專業,尤其大數據相關專業的本科和碩士研究生教材或參考書。