資料匯入、整理、變換、視覺化與模型建立
「Hadley Wickham是資料科學領域的傳奇,發明了一種從來沒人想過的全新方式來進行資料分析。他與Garrett Grolemund合著的這本新書詳細介紹了這種創新做法,它將會成為當代資料分析師的聖經。」
─Roger D. Peng, 生物統計學教授
Johns Hopkins大學Bloomberg公共衛生學院
學習如何使用R將原始資料轉化為洞見、知識和理解。本書為你介紹R、RStudio,還有tidyverse這個R套件集合,你將學會運用其中相輔相成的套件,使資料科學變得快速,流暢和有趣。《R 資料科學》是為了讓你能夠盡快開始實作資料科學而設計,適合以前沒有程式設計經驗的讀者。
作者Hadley Wickham和Garrett Grolemund將引導你走過資料的匯入、整理、探索,以及建立模型和傳達結果這些步驟。你將全面理解資料科學的運作週期,並獲得管理其中細節所需的基本工具。
你會學到如何
■ Wrangle:將你的資料集轉為方便分析的形式
■ Program:使用強大的R工具以更清楚且輕鬆的方式解決資料問題
■ Explore:審查你的資料,產生假設,並快速地測試它們
■ Model:提供低維摘要,捕捉你資料集所含的真實「訊號」
■ Communicate:使用R Markdown來整合說明文字、程式碼以及結果
作者簡介:
Hadley Wickham 是RStudio的首席科學家,也是R Foundation的成員。他建置使資料科學更容易、更快速、更有趣的工具(用於計算和輔助認知的都有)。更多資訊在他的網站 http://hadley.nz。
Garrett Grolemund 是RStudio的統計學家、教學人員以及大師級講師。他是《Hands-On Programming with R》(O’Reilly)的作者。Garrett的許多教學影片都可在oreilly.com/safari取得。