內容簡介
【關鍵數據分析指標】解說 + 【SQL 擷取、彙總數據】手法,
教你從枯燥的資料表中挖出對決策有幫助的資訊!
在一般使用上, SQL 還是常被當作 Web 服務的後端, 只用於 RDB (關聯式資料庫) 的查詢, 普遍缺乏將 SQL 使用在分析用途上的 Knowhow。然而目前各種大數據平台 (Apache Hadoop、Spark、Google / Amazon 的付費雲端平台…) 的盛行, 當中都少不了運用 SQL 查詢語法來擷取、分析平台上所儲存的數據, 取得重要的決策資訊。
本書涵蓋大數據平台上的 SQL 分析工具 (Apache Hive、SparkSQL、Google BigQuery、Amazon Redshift、PostgreSQL), 以滿滿的商業分析實例, 教你從看似千篇一律的網站 Log、營收數據「挖寶」, 其中包括【營收狀況分析】、社群/內容/購物網站的【使用者行為分析】、【網站營運績效分析】等, 會先介紹可派上用場的分析指標, 接著示範如何以 SQL 語法來取得這些指標所需的數據。
本書期望提供大數據分析相關知識給分析人員與工程師, 養成實務上所需的技術力與分析力, 成為活用數據、改善公司業務的關鍵人才!
●【實用分析指標解說, 養成必備數據分析力】
【營收狀況分析】
判讀營收的變化趨勢 → Z 圖表
依營收貢獻度將商品劃分等級, 判別銷售情形 → ABC 分析
精準掌握商品成長或衰退情形 → Fan chart
【社群網站、內容網站、購物網站...的使用者行為分析】
區分重度、輕度使用者, 客製化服務內容 → 十分位分析、RFM 分析
調查使用者的傾向 → 留存率、回訪率
彙總用戶消費額, 估算集客的合理成本 → ARPU 指標、LTV 指標
【網站營運績效分析】
評估網頁的內容是否夠吸引人 → 離開率、讀完率
檢測申請表單的效用, 避免申請到一半離開 → 表單跳脫率
本書特色 :
●技術力 X 分析力 的完美結合!IT、企劃分析、行銷人員一定要會的大數據分析術!
●以 split_part / URL / COALESCE / CONCAT / SIGN / greatest / least / NTILE / SUM ...等函數撰寫 SQL 查詢語法 (Query), 輕鬆獲得各項分析指標數據
●涵蓋熱門大數據分析平台, Apache Hive / Google BigQuery / SparkSQL / Amazon Redshift / PostgreSQL 全適用
教你從枯燥的資料表中挖出對決策有幫助的資訊!
在一般使用上, SQL 還是常被當作 Web 服務的後端, 只用於 RDB (關聯式資料庫) 的查詢, 普遍缺乏將 SQL 使用在分析用途上的 Knowhow。然而目前各種大數據平台 (Apache Hadoop、Spark、Google / Amazon 的付費雲端平台…) 的盛行, 當中都少不了運用 SQL 查詢語法來擷取、分析平台上所儲存的數據, 取得重要的決策資訊。
本書涵蓋大數據平台上的 SQL 分析工具 (Apache Hive、SparkSQL、Google BigQuery、Amazon Redshift、PostgreSQL), 以滿滿的商業分析實例, 教你從看似千篇一律的網站 Log、營收數據「挖寶」, 其中包括【營收狀況分析】、社群/內容/購物網站的【使用者行為分析】、【網站營運績效分析】等, 會先介紹可派上用場的分析指標, 接著示範如何以 SQL 語法來取得這些指標所需的數據。
本書期望提供大數據分析相關知識給分析人員與工程師, 養成實務上所需的技術力與分析力, 成為活用數據、改善公司業務的關鍵人才!
●【實用分析指標解說, 養成必備數據分析力】
【營收狀況分析】
判讀營收的變化趨勢 → Z 圖表
依營收貢獻度將商品劃分等級, 判別銷售情形 → ABC 分析
精準掌握商品成長或衰退情形 → Fan chart
【社群網站、內容網站、購物網站...的使用者行為分析】
區分重度、輕度使用者, 客製化服務內容 → 十分位分析、RFM 分析
調查使用者的傾向 → 留存率、回訪率
彙總用戶消費額, 估算集客的合理成本 → ARPU 指標、LTV 指標
【網站營運績效分析】
評估網頁的內容是否夠吸引人 → 離開率、讀完率
檢測申請表單的效用, 避免申請到一半離開 → 表單跳脫率
本書特色 :
●技術力 X 分析力 的完美結合!IT、企劃分析、行銷人員一定要會的大數據分析術!
●以 split_part / URL / COALESCE / CONCAT / SIGN / greatest / least / NTILE / SUM ...等函數撰寫 SQL 查詢語法 (Query), 輕鬆獲得各項分析指標數據
●涵蓋熱門大數據分析平台, Apache Hive / Google BigQuery / SparkSQL / Amazon Redshift / PostgreSQL 全適用