Impala是 Cloudera主導開發的新型查詢系統,它提供 SQL語義,能查詢存儲在 Hadoop的 HDFS和 HBase中的 PB級大量資料。
Impala比原來基於 MapReduce的 Hive SQL查詢速度提升 3~90倍,因此, Impala有可能完全取代 Hive。作者基於自己在本職工作中應用 Impala的實踐和心得編寫了本書。
本書共分 10章,全面介紹大數據分析引擎 Impala的技術背景、安裝與配置、架構、操作方法、性能優化,以及豐富的應用設計原則和應用案例。
本書緊扣目前計算技術發展重點,適合所有大數據分析人員、大數據開發人員和大數據管理人員參考使用。
•Cloudera官方推薦
•第一本全面說明Impala的中文書
適用:大數據分析人員、大數據開發人員、大數據管理人員。
作者簡介:
賈傳青
資料架構師,Oracle OCM,DB2 移轉之星,TechTarget特約作家,從資料庫向大數據轉型的先行者。曾服務於中國聯通、中國電信、建設銀行、PICC等,目前任職一家大數據解決方案提供商,致力於使用大數據技術解決傳統資料庫無法解決的問題。