這是一本大資料技術入門的簡明教材。全書理論和實踐相結合,以應用實戰為主,深入淺出地講解每個知識點,對每個應用實驗按學習習慣,分步驟講解,每個步驟都有文字說明和效果截圖,使讀者能清晰地知曉動手實操的效果和錯誤之處。 全書分為9章,全面介紹了大資料技術的相關基礎知識、HDFS和資料庫、採集傳輸工具、挖掘分析演算法、Spark計算框架、視覺化、大資料安全、大資料應用等內容,著重介紹了HDFS分散式檔案系統、NoSQL等各種資料庫、資料倉庫Hive,以及資料獲取分析技術,並配套了詳細的實驗教程以及練習題。 本書適合作為高等院校電腦、軟體工程、大資料專業高職、本科生的教材,同時可供企業中從事大資料開發的工程師和科技工作者參考。