Apache Spark大數據分析:基於Azure Databricks雲平台 | 拾書所

Apache Spark大數據分析:基於Azure Databricks雲平台

$ 455 元 原價 455

Azure Databricks是一款基於雲的大數據分析和機器學習平台,
用於實現基於Apache Spark的數據處理,為快速增長的海量數據的處理和決策需求分析提供了良好的支撐。
《Apache Spark大數據分析:基於Azure Databricks雲平台》
詳細介紹基於Azure Databricks雲平台來使用Apache Spark完成大規模數據處理和分析的方法。
本書總計11章,首先介紹大規模數據分析相關的概念;然後介紹受管的Spark及其與Databricks的關係,
以及Databricks的版本差異和使用方法(涵蓋工作區、集群、筆記本、Databricks文件系統、數據導入/導出等內容);
接著介紹使用SQL和Python分別實現數據分析的過程,數據提取、變換、加載、存儲、
優化技巧等高階數據處理方法以及外部連接工具、生產環境集成等內容;最後探討了運行機器學習算法、
合併數據更新以及通過API運行Databricks、Delta流處理等高階主題。
作為數據分析領域的入門書,本書具有很強的實用性,
可供數據工程師、數據分析師和決策分析人員等學習和參考。

Brand Slider