“大數據”已連年入選IT領域的熱點話題,人們每天都會通過因特網、移動設備等生產大量數據。如何從海量數據中洞悉出隱藏其後的見解是當今社會各領域人士極為關註的話題。本系列圖書以“大數據分析師”應掌握的IT技術為主線,共分兩捲,以7個模塊(第1捲包括4個模塊,第2捲包括3個模塊)分別介紹大數據入門,分析和R編程入門,使用R進行數據分析,用R進行高級分析,機器學習的概念,社交媒體、移動分析和可視化,大數據分析的行業應用等核心內容,全面且詳盡地涵蓋了大數據分析的各個領域。適用於想成為大數據分析師的人員以及所有對大數據分析感興趣的技術人員和決策者閱讀。
本書為第1捲,首先提供大數據的概覽,介紹大數據概念及其在商業中的應用、處理大數據的技術、Hadoop生態系統和MapReduce的相關內容,然後介紹如何理解分析、分析方法與工具,重點講解流行分析工具R,介紹如何將數據集導入R和從R導出數據、在R中如何操縱和處理數據,最後詳細介紹R中的函數和包、R的描述性統計、R中的圖形分析、R中的假設檢驗、R中的線性回歸、非線性回歸、聚類分析、決策樹、R和Hadoop的集成及Hive,通過這些實戰內容,使讀者掌握R語言在數據分析中的全面應用。通過本書,讀者能對大數據概念、重要性及其應用有全面的瞭解,熟悉各種大數據分析工具。