開源大數據分析引擎 Impala 實戰 | 拾書所

開源大數據分析引擎 Impala 實戰

$ 301 元 原價 354

 

<內容簡介>

    Impala是Cloudera公司主導開發的新型查詢系統,它提供SQL語義,能查詢存儲在Hadoop的HDFS和HBase中的PB級大數據。Impala 1.0版比原來基於MapReduce的Hive SQL查詢速度提升3?90倍,因此,Impala有可能完全取代Hive。作者賈傳青基於自己在本職工作中應用Impala的實踐和心得編寫了這本《開源大數據分析引擎Impala實戰》。
    本書共分10章,全面介紹開源大數據分析引擎Impala的技術背景、安裝與配置、架構、操作方法、性能優化,以及最富技術含量的應用設計原則和應用案例。
    本書緊扣目前計算技術發展熱點,適合所有大數據分析人員、大數據開發人員和大數據管理人員參考使用。

<章節目錄>

第1章  Impala概述、安裝與配置
  1.1 Impala概述
  1.2 Cloudera Manager安裝準備
  1.3 CM及 CDH安裝
  1.4 Hive安裝
  1.5 Impala安裝
第2章  Impala入門示例
  2.1 數據加載
  2.2 數據查詢
  2.3 分區表
  2.4 外部分區表
  2.5 笛卡爾連接
  2.6 更新元數據
第3章  Impala概念及架構
  3.1 Impala服務器組件
    3.1.1 Impala Daemon
    3.1.2 Impala Statestore
    3.1.3 Impala Catalog
  3.2 Impala應用編程
    3.2.1 Impala SQL方言
    3.2.2 Impala編程接口概述
  3.3 與Hadoop生態系統集成
    3.3.1 與Hive集成
    3.3.2 與HDFS集成
    3.3.3 使用HBase
第4章  SQL語句
  4.1 註釋
  4.2 數據類型
    4.2.1 BIGINT
    4.2.2 BOOLEAN
    4.2.3 DOUBLE
    4.2.4 FLOAT
    4.2.5 INT
    4.2.6 REAL
    4.2.7 SMALLINT
    4.2.8 STRING
    4.2.9 TIMESTAMP
    4.2.10 TINYINT
  4.3 常量
    4.3.1 數值常量
    4.3.2 字符串常量
    4.3.3 布爾常量
    4.3.4 時間戳常量
    4.3.5 NULL
  4.4 SQL操作符
    4.4.1 BETWEEN操作符
    4.4.2 比較操作符
    4.4.3 IN操作符
    4.4.4 IS NULL操作符
    4.4.5 LIKE操作符

    4.4.6 REGEXP操作符
  4.5 模式對象和對象名稱
    4.5.1 別名
    4.5.2 標示符
    4.5.3 數據庫
    4.5.4 表
    4.5.5 視圖
    4.5.6 函數
  4.6 SQL語句
    4.6.1 ALTER TABLE
    4.6.2 ALTER VIEW
    4.6.3 COMPUTE STATS
    4.6.4 CREATE DATABASE
    4.6.5 CREATE FUNCTION
    4.6.6 CREATE TABLE
    4.6.7 CREATE VIEW
    4.6.8 DESCRIBE
    4.6.9 DROP DATABASE
    4.6.10 DROP FUNCTION
    4.6.11 DROP TABLE
    4.6.12 DROP VIEW
    4.6.13 EXPLAIN
    4.6.14 INSERT
    4.6.15 INVALIDATE METADATA
    4.6.16 LOAD DATA
    4.6.17 REFRESH
    4.6.18 SELECT
    4.6.19 SHOW
    4.6.20 USE
  4.7 內嵌函數<

Brand Slider