本書由Apache Storm項目核心貢獻者親筆撰寫,融合了作者豐富的Storm實戰經驗,通過大量示例,全面而系統地講解使用Storm進行分佈式實時計算的核心概念及應用,並針對不同的應用場景,給出多種基於Storm的設計模式,為讀者快速掌握Storm分佈式實時計算提供系統實踐指南。
全書分為10章:第1章介紹使用Storm建立一個分佈式流式計算應用所涉及的核心概念,包括Storm的數據結構、開發環境的搭建,以及Storm程序的開發和調試技術等;第2章詳細講解Storm集群環境的安裝和搭建,以及如何將topology部署到分佈式環境中;第3章通過傳感器數據實例詳細介紹Trident topology;第4章講解如何使用Storm和Trident進行實時趨勢分析;第5章介紹如何使用storm進行圖形分析,將數據持久化存儲在圖形數據庫中,通過查詢數據來發現其中潛在的聯系;第6章講解如何在Storm上使用遞歸實現一個典型的人工智能算法;第7章演示集成Storm和非事務型系統的復雜性,通過集成Storm和開源探索性分析架構 Druid實現一個可配置的實時系統來分析金融事件。第8章探討Lambda體系結構的實現方法,講解如何將批處理機制和實時處理引擎結合起來構建一個可糾錯的分析系統;第9章講解如何將Pig腳本轉化為topology,並且使用Storm-YARN部署topology,從而將批處理系統轉化為實時系統;第lo章介紹如何在雲服務提供商提供的主機環境下部署和運行Storm。
全書分為10章:第1章介紹使用Storm建立一個分佈式流式計算應用所涉及的核心概念,包括Storm的數據結構、開發環境的搭建,以及Storm程序的開發和調試技術等;第2章詳細講解Storm集群環境的安裝和搭建,以及如何將topology部署到分佈式環境中;第3章通過傳感器數據實例詳細介紹Trident topology;第4章講解如何使用Storm和Trident進行實時趨勢分析;第5章介紹如何使用storm進行圖形分析,將數據持久化存儲在圖形數據庫中,通過查詢數據來發現其中潛在的聯系;第6章講解如何在Storm上使用遞歸實現一個典型的人工智能算法;第7章演示集成Storm和非事務型系統的復雜性,通過集成Storm和開源探索性分析架構 Druid實現一個可配置的實時系統來分析金融事件。第8章探討Lambda體系結構的實現方法,講解如何將批處理機制和實時處理引擎結合起來構建一個可糾錯的分析系統;第9章講解如何將Pig腳本轉化為topology,並且使用Storm-YARN部署topology,從而將批處理系統轉化為實時系統;第lo章介紹如何在雲服務提供商提供的主機環境下部署和運行Storm。