作者精心彙整大數據分析工作所需之理論知識、系統開發技術、程式撰寫與建立模型等實務經驗,以資料庫實作為主軸導向大數據應用與未來趨勢。
由資料分析、資料倉儲到資料探勘,延展至資料應用,皆備周詳說明及予精闢釋例,讓讀者一目了然,於觀念結構建立上能更有效率的精準掌握;所舉列之重點案例更加讓讀者透過案例分析,而能對資料庫概念建置更深層的體認與領會。
本書對有志成為資料科學家的初學者而言,絕對是一本最好的入門書籍。
------------------------------------------------------------------------------
CH1、CH2、CH3、CH5:主要介紹關聯式資料庫中進階技巧,以檢視表為開端,接續單元介紹索引技術、交易管理和可程式性物件,讓讀者建立在處理大量結構化資料時能更有效率的觀念與基礎。
CH4:介紹 ADO.NET資料庫程式設計,讓讀者從無到有建置一個小型資訊系統專案,建立對於資訊系統開發之認識,以及提升程式撰寫的能力。
CH6:介紹資料倉儲與資料探勘,對於監督式學習或非監督式學習相關知識有一定程度的了解。
CH7:介紹SQL Server 2016版才有的新功能,也是微軟致力於大數據分析的解決方案,主要提供資料科學家能夠透過原先所熟悉的R語言,不論是在交談式介面中透過SQL Server R Services直接撰寫R腳本指令進行資料分析,或是在Visual Studio.NET中透過R Tools for Visual Studio或Microsoft R Client的安裝,在原有Visual Studio開發環境撰寫R指令從事各種機器學習,進行關聯、分類、集群和預測的工作。