基於 Apache Kylin 構建大數據分析平臺 | 拾書所

基於 Apache Kylin 構建大數據分析平臺

$ 393 元 原價 414

<內容簡介>

Apache Kylin是一個開源的分佈式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,最初由eBay公司開發並貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。
本書分為21章,詳細講解Apache Kylin概念、安裝、配置、部署,讓讀者對Apache Kylin構建大數據分析平臺有一個感性認識。同時,本書從應用角度,結合Dome和實例介紹了用於多維分析的Cube算法的創建、配置與優化。最後還介紹了Kyligence公司發布KAP大數據分析平臺,對讀者有極大的參考價值。
本書適合大數據技術初學者、大數據分析人員、大數據架構師等,也適合用於高等院校和培訓學校相關專業師生教學參考。

<章節目錄>

第—部分Apache Kylin基礎部分
第1章Apache Kylin前世今生
1.1Apache Kylin的背景
1.2Apache Kylin的應用場景
1.3Apache Kylin的發展歷程
第2章Apache Kylin前奏
2.1事實表和維表
2.2星型模型和雪花型模型
2.2.1星型模型
2.2.2雪花型模型
2.2.3星型模型示例
2.3OLAP
2.3.1OLAP分類
2.3.2OLAP的基本操作
2.4數據立方體(Data Cube)
第3章Apache Kylin工作原理和體系架構
3.1 Kylin工作原理
3.2Kylin體系架構
3.3Kylin中的核心部分:Cube構建
3.4Kylin的SQL查詢
3.5Kylin的特性和生態圈
第4章搭建CDH大數據平臺
4.1系統環境和安裝包
4.1.1系統環境
4.1.2安裝包的下載
4.2準備工作:系統環境搭建
4.2.1網絡配置(CDH集群所有節點1
4.2.2打通SSH,設置ssh無密碼登錄(所有節點)
4.3正式安裝CDH:準備工作
4.4正式安裝CDH5:安裝配置
4.4.1CDH5的安裝配置
4.4.2對Hive、HBase執行簡單操作
第5章使用Kylin構建企業大數據分析平臺的4種部署方式
5.1Kylin部署的架構
5.2Kylin的四種典型部署方式
第6章單獨為Kylin部署HBase集群
第7章部署Kylin集群環境
7.1部署Kylin的先決條件
7.2部署Kylin集群環境
7.3為Kylin集群搭建負載均衡器
7.3.1搭建Nginx環境
7.3.2配置Nginx實現Kylin的負載均衡
第二部分Apache Kylin進階部分
第8章Demo案例實戰
8.1Sample Cube案例描述
8.2Sample Cube案例實戰
8.2.1準備數據
8.2.2構建Cube
第9章多維分析的Cube創建實戰
9.1Cube模型
9.2創建Cube的流程
9.2, 1步驟一:Hive中事實表,以及多張維表的處理
9.2.2步驟二:Kylin中建立項目(Project)
9.2.3步驟三:Kylin中建立數據源(Data Source)
9.2.4步驟四:Kylin中建立數據模型(Model)
9.2.5步驟五:Kylin中建立Cube
9.2.6步驟六:Build Cube
9.2.7步驟七:查詢Cube
第10章Build Cube的來龍去脈
10.1流程分析
10.2小結
第三部分Apache Kylin高級部分
第11章Cube優化
第12章備份Kylin的Metadata
12.1Kylin的元數據
12.2備份元數據
12.3恢復元數據
第13章使用Hive視圖
13.1使用Hive視圖
13.2使用視圖實戰
第14章Kylin的垃圾清理
14.1清理元數據
14.2清理存儲器數據
第15章JDBC訪問方式
第16章通過RESTful訪問Kylin
第17章Kylin版本之間升級
17.1從1.5.2升級到最新版本1.5.3
17.2從1.5.1升級到1.5.2版本
17.3從Kylin l.5.2.1升級到Kylin 1.5.3實戰
17.4補充內容
第18章大數據可視化實踐

Brand Slider