本書由資深數據科學專家撰寫,圍繞使用R進行數據科學編程所需的實際步驟展開,介紹了有關該主題的工具和技術的整個生態系統,Amazon全五星評價。
全書共六部分,21章。第一部分(第1~2章)講述了下載和安裝本書其他部分所需軟件的步驟,其中第1章詳細介紹瞭如何安裝文本編輯器、Bash終端、R解釋器和RStudio程序,第2章描述瞭如何使用命令行進行基本的文件系統瀏覽。第二部分(第3~4章)介紹了項目管理的基礎技術,其中第3章介紹了用於逐行跟蹤代碼變化的git軟件,以及相應的流行代碼托管和協作服務器GitHub,第4章描述瞭如何使用Markdown生成用於共享和展示數據所需的結構良好且樣式良好的文檔。第三部分(第5~8章)介紹R編程語言,其中第5章講解R語言的基本語法,第6章描述諸如函數之類的基本編程概念和該語言的基本數據結構,第7章和第8章分別講解了向量和列表。第四部分(第9~14章)講解數據清理,其中第9章介紹用於理解真實數據結構的技術與概念,第10章講解R中常用於管理數據的數據結構——數據框,第11章和第12章描述R中交互編程處理數據的兩個包——dplyr和tidyr,第13章和第14章詳細描述如何使用應用程序編程接口從數據庫和基於Web的數據服務中加載數據。第五部分(第15~17章)講解數據可視化,其中第15章概述數據可視化的原則,第16章詳細描述如何在R中使用ggplot2可視化包,第17章介紹3個R擴展包,以便產生有吸引力的交互式可視化結果。第六部分(第18~21章)講解如何構建與共享應用程序,其中第18章講解如何使用R Markdown將分析轉換為可共享文檔與網站,第19章描述Shiny框架(可以借助該框架使用R來創建交互式Web應用程序),第20章描述如何進行協作,第21章則詳細說明瞭如何在本書以外拓展自己的知識。
Michael Freeman和Joel Ross為立志從事數據科學的新手提供了學習基本編程技能的權威資源。
——Jared Lander,叢書編輯
本書包括可將不同領域的原始數據轉換成有價值的情報所需的基礎技術,涉及的科學領域涵蓋從城市規劃到精密醫學,即使是沒有編程或者數據科學經驗的新手也可學習。
Michael Freeman與Joel Ross這兩位專家從安裝和配置可用來解決專業級數據科學問題的工具開始講解,這些工具包括廣泛使用的R語言、RStudio集成開發環境和Git版本控制系統。他們在書中解釋瞭如何將數據清理成可用的格式,以及如何分析和可視化數據,以便讓他人瞭解你所揭示的規律。緊接著,本書還講述了以新方式、大規模探索數據的強大的R語言編程技能。全書通篇使用的實例和真實練習可幫助讀者快速分析自己的數據集,並獲取可付諸實際的答案。
本書內容包括:
安裝完整的數據科學環境,包括R和RStudio
使用GitHub對數據科學項目進行托管、管理和協作
掌握R語言基礎:語法、編程概念和數據結構
為了成功分析,加載、格式化、探索並重構數據
與數據庫和Web API進行交互
生成吸引人的、交互式的、準確和直觀的可視化表示
與其他數據科學團隊成員順利合作
全書共六部分,21章。第一部分(第1~2章)講述了下載和安裝本書其他部分所需軟件的步驟,其中第1章詳細介紹瞭如何安裝文本編輯器、Bash終端、R解釋器和RStudio程序,第2章描述瞭如何使用命令行進行基本的文件系統瀏覽。第二部分(第3~4章)介紹了項目管理的基礎技術,其中第3章介紹了用於逐行跟蹤代碼變化的git軟件,以及相應的流行代碼托管和協作服務器GitHub,第4章描述瞭如何使用Markdown生成用於共享和展示數據所需的結構良好且樣式良好的文檔。第三部分(第5~8章)介紹R編程語言,其中第5章講解R語言的基本語法,第6章描述諸如函數之類的基本編程概念和該語言的基本數據結構,第7章和第8章分別講解了向量和列表。第四部分(第9~14章)講解數據清理,其中第9章介紹用於理解真實數據結構的技術與概念,第10章講解R中常用於管理數據的數據結構——數據框,第11章和第12章描述R中交互編程處理數據的兩個包——dplyr和tidyr,第13章和第14章詳細描述如何使用應用程序編程接口從數據庫和基於Web的數據服務中加載數據。第五部分(第15~17章)講解數據可視化,其中第15章概述數據可視化的原則,第16章詳細描述如何在R中使用ggplot2可視化包,第17章介紹3個R擴展包,以便產生有吸引力的交互式可視化結果。第六部分(第18~21章)講解如何構建與共享應用程序,其中第18章講解如何使用R Markdown將分析轉換為可共享文檔與網站,第19章描述Shiny框架(可以借助該框架使用R來創建交互式Web應用程序),第20章描述如何進行協作,第21章則詳細說明瞭如何在本書以外拓展自己的知識。
Michael Freeman和Joel Ross為立志從事數據科學的新手提供了學習基本編程技能的權威資源。
——Jared Lander,叢書編輯
本書包括可將不同領域的原始數據轉換成有價值的情報所需的基礎技術,涉及的科學領域涵蓋從城市規劃到精密醫學,即使是沒有編程或者數據科學經驗的新手也可學習。
Michael Freeman與Joel Ross這兩位專家從安裝和配置可用來解決專業級數據科學問題的工具開始講解,這些工具包括廣泛使用的R語言、RStudio集成開發環境和Git版本控制系統。他們在書中解釋瞭如何將數據清理成可用的格式,以及如何分析和可視化數據,以便讓他人瞭解你所揭示的規律。緊接著,本書還講述了以新方式、大規模探索數據的強大的R語言編程技能。全書通篇使用的實例和真實練習可幫助讀者快速分析自己的數據集,並獲取可付諸實際的答案。
本書內容包括:
安裝完整的數據科學環境,包括R和RStudio
使用GitHub對數據科學項目進行托管、管理和協作
掌握R語言基礎:語法、編程概念和數據結構
為了成功分析,加載、格式化、探索並重構數據
與數據庫和Web API進行交互
生成吸引人的、交互式的、準確和直觀的可視化表示
與其他數據科學團隊成員順利合作