內容簡介
看到專為華人讀者發佈的這一本中文版Impala書籍,我非常欣喜,這無疑
對華人使用者更進一步地使用Hadoop,解決他們的業務問題有很大幫助。因此
,我要感謝所有為發佈本書做出貢獻的人們。~~ Cloudera 副總裁 苗凱翔 博
士
第一本全面說明Impala 的中文書, 既可以作為想快速架設以Hadoop為基
礎的資料倉儲的原資料庫同好們的優秀參考書,又可以成為對Spark 有興趣的
使用者的架構了解入門書籍。~~ EasyHadoop社區創始人,eXadoop公司創始
人 向磊
這是我看到的第一本說明Impala技術和應用最系統化的中文書籍。不要沉
浸於討論多大規模的資料才是「大數據」,本書將帶領讀者快速地掌握這個技
術,開啟大數據時代的窗戶。~~中國中信證券 莊偉波
對華人使用者更進一步地使用Hadoop,解決他們的業務問題有很大幫助。因此
,我要感謝所有為發佈本書做出貢獻的人們。~~ Cloudera 副總裁 苗凱翔 博
士
第一本全面說明Impala 的中文書, 既可以作為想快速架設以Hadoop為基
礎的資料倉儲的原資料庫同好們的優秀參考書,又可以成為對Spark 有興趣的
使用者的架構了解入門書籍。~~ EasyHadoop社區創始人,eXadoop公司創始
人 向磊
這是我看到的第一本說明Impala技術和應用最系統化的中文書籍。不要沉
浸於討論多大規模的資料才是「大數據」,本書將帶領讀者快速地掌握這個技
術,開啟大數據時代的窗戶。~~中國中信證券 莊偉波
作者簡介
賈傳青
資料架構師,Oracle OCM,DB2 移轉之星,TechTarget特約作家,從資料庫
向大數據轉型的先行者。曾服務於中國聯通、中國電信、建設銀行、PICC等
,目前任職一家大數據解決方案提供商,致力於使用大數據技術解決傳統資
料庫無法解決的問題。
資料架構師,Oracle OCM,DB2 移轉之星,TechTarget特約作家,從資料庫
向大數據轉型的先行者。曾服務於中國聯通、中國電信、建設銀行、PICC等
,目前任職一家大數據解決方案提供商,致力於使用大數據技術解決傳統資
料庫無法解決的問題。
內容目錄
Chapter 01 Impala 概述、安裝與設定
1.1 Impala 概述
1.2 Cloudera Manager 安裝準備
1.3 CM 及CDH 安裝
1.4 Hive 安裝
1.5 Impala 安裝
Chapter 02 Impala 入門範例
2.1 資料載入
2.2 資料查詢
2.3 分區表
2.4 外部分區表
2.5 笛卡爾連接
2.6 更新中繼資料
Chapter 03 Impala 概念及架構
3.1 Impala 伺服器元件
3.2 Impala 應用程式設計
3.3 與Hadoop 生態系統整合
Chapter 04 SQL 敘述
4.1 註釋
4.2 資料類型
4.3 常數
4.4 SQL 運算符號
4.5 模式物件和物件名稱
4.6 SQL 敘述
4.7 內嵌函數
4.8 聚集函數
4.9 使用者自訂函數UDF
4.10 Impala SQL &Hive QL
4.11 將SQL 移植到Impala 上
Chapter 05 Impala shell
5.1 命令列選項
5.2 連接到Impalad
5.3 執行指令
5.4 指令參考
5.5 查詢參數設定
Chapter 06 Impala 管理
6.1 存取控制和查詢佇列
6.2 使用YARN 資源管理(CDH5)
6.3 為處理程序,查詢,階段設定逾時限制
6.4 透過代理實現Impala 高可用性
6.5 管理磁碟空間
Chapter 07 Impala 儲存
7.1 檔案格式選擇
7.2 Text
7.3 Parquet
7.4 Avro
7.5 RCFile
7.6 SequenceFile
7.7 HBase
Chapter 08 Impala 分區
8.1 分區技術適用場合
8.2 分區表相關SQL 敘述
8.3 分區修剪
8.4 分區鍵列
8.5 使用不同的檔案格式
Chapter 09 Impala 效能最佳化
9.1 最佳做法
9.2 連接查詢最佳化
9.3 使用統計資訊
9.4 基準測試
9.5 控制資源使用
9.6 效能測試
9.7 使用EXPLAIN 資訊
9.8 使用PROFILE 資訊
Chapter 10 Impala 設計原則與應用案例
10.1 設計原則
10.2 應用案例
1.1 Impala 概述
1.2 Cloudera Manager 安裝準備
1.3 CM 及CDH 安裝
1.4 Hive 安裝
1.5 Impala 安裝
Chapter 02 Impala 入門範例
2.1 資料載入
2.2 資料查詢
2.3 分區表
2.4 外部分區表
2.5 笛卡爾連接
2.6 更新中繼資料
Chapter 03 Impala 概念及架構
3.1 Impala 伺服器元件
3.2 Impala 應用程式設計
3.3 與Hadoop 生態系統整合
Chapter 04 SQL 敘述
4.1 註釋
4.2 資料類型
4.3 常數
4.4 SQL 運算符號
4.5 模式物件和物件名稱
4.6 SQL 敘述
4.7 內嵌函數
4.8 聚集函數
4.9 使用者自訂函數UDF
4.10 Impala SQL &Hive QL
4.11 將SQL 移植到Impala 上
Chapter 05 Impala shell
5.1 命令列選項
5.2 連接到Impalad
5.3 執行指令
5.4 指令參考
5.5 查詢參數設定
Chapter 06 Impala 管理
6.1 存取控制和查詢佇列
6.2 使用YARN 資源管理(CDH5)
6.3 為處理程序,查詢,階段設定逾時限制
6.4 透過代理實現Impala 高可用性
6.5 管理磁碟空間
Chapter 07 Impala 儲存
7.1 檔案格式選擇
7.2 Text
7.3 Parquet
7.4 Avro
7.5 RCFile
7.6 SequenceFile
7.7 HBase
Chapter 08 Impala 分區
8.1 分區技術適用場合
8.2 分區表相關SQL 敘述
8.3 分區修剪
8.4 分區鍵列
8.5 使用不同的檔案格式
Chapter 09 Impala 效能最佳化
9.1 最佳做法
9.2 連接查詢最佳化
9.3 使用統計資訊
9.4 基準測試
9.5 控制資源使用
9.6 效能測試
9.7 使用EXPLAIN 資訊
9.8 使用PROFILE 資訊
Chapter 10 Impala 設計原則與應用案例
10.1 設計原則
10.2 應用案例
ISBN: 9789863797913