<內容介紹>
在大數據時代,R以其強大的數據分析挖掘、可視化繪圖等功能,越來越受到社會各個領域的青睞。現在,R的計算引擎、性能、程序包都得到了提升,其中R與大數據分析平臺Hadoop的結合,實現了R對大數據的分析式處理分析。這些不僅大大擴展了R的應用,也擴大了R在各行業的需求。
為了更好地適應新形勢,掌握大數據分析處理的相關知識是很有必要的。陳工孟、須成忠編著的《大數據分析--R基礎及應用》從理論基礎、方法、實證三方面詳細地闡釋了R和RHadoop的相關理論、技術以及應用,使讀者瞭解大數據的基礎概念,掌握R以及Rhadoop大數據分析技術。本書不僅適合高等院校的各相關專業的本專科生、研究生,也適合零編程基礎的科研人員以及對大數據分析技術感興趣的人士閱讀。本書在內容的選擇和結構的安排上進行了深入的思考,使得不論是R或RHadoop的初學者還是具備一定相關專業知識的人員都能從本書中得到一定的收穫或啟發。
<章節目錄>
第一部分 大數據簡介
第1章 大數據概述
1.1 大數據的概念
1.2 大數據的特徵
1.3 大數據的產生
1.4 大數據應用案例
第2章 大數據相關技術
2.1 數據採集和準備
2.2 分佈式數據庫
2.3 分佈式數據分析框架
2.3.1 Hadoop
2.3.2 HDFS
2.3.3 HBase
2.3.4 Hive
2.3.5 MapReduce
2.3.6 Strom
2.4 大數據分析與R
2.4.1 RHadoop
2.4.2 RHIPE
2.4.3 RHive
2.4.4 RHBase
2.5 國泰安的大數據
2.5.1 大數據實驗室建設
2.5.2 大數據分析平臺
第二部分 R語言
第3章 R語言簡介
3.1 R語言概述
3.2 R的下載、安裝和使用
3.2.1 RGui界面
3.2.2 RStudio界面
3.2.3 R的運行
3.2.4 工作目錄和工作空間
3.2.5 R語言的幫助
3.3 R的包
3.3.1 包的獲取
3.3.2 包的安裝
3.3.3 包的加載
3.3.4 包的使用
第4章 R語言基本操作
4.1 數據結構
4.2 數據的基本操作
4.2.1 賦值和創建
4.2.2 數據的運算
4.2.3 數據的導入
4.3 數據的管理
4.3.1 數據排序
4.3.2 數據集的合併
4.3.3 剔除變量
4.3.4 數據集提取
4.3.5 subset函數
4.4 常用函數
第5章 R語言繪圖
5.1 繪圖參數
5.1.1 符號、線條與顏色
5.1.2 標題、坐標軸與圖例
5.1.3 文本屬性
5.1.4 圖形的組合
5.2 高級繪圖函數
5.2.1 通用二維圖
5.2.2 餅圖
5.2.3 箱線圖
5.2.4 條形圖
5.2.5 直方圖
5.2.6 核密度圖
5.2.7 點圖
5.3 低級繪圖函數
第6章 R語言數據分析
6.1 數據處理基礎函數
6.1.1 數學函數
6.1.2 統計函數
6.1.3 概率函數
6.1.4 數據分析實例
6.2 描述性統計分析
6.2.1 描述統計函數
6.2.2 軟件包的描述統計
6.3 多元統計分析
6.3.1 方差分析
6.3.2 判別分析
6.3.3 聚類分析
6.3.4 主成分分析
6.3.5 因子分析
6.3.6 典型相關分析