本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的原理和實戰,億級數據處理平臺Spark性能調優,Spark機器學習庫,Spark 3.0的新特性和數據湖等。
本書適合Spark開發人員和Spark運維人員閱讀。
本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的原理和實戰,億級數據處理平臺Spark性能調優,Spark機器學習庫,Spark 3.0的新特性和數據湖等。
本書適合Spark開發人員和Spark運維人員閱讀。