這是一本詳細講解電腦視覺算法實現以及MXNet框架的原理和使用的工具書。
作者是網易的資深電腦視覺算法工程師。本書融合了他豐富的工程實踐經驗,一方面詳細講解了深度學習框架MXNet的技術原理和應用方法,另一方面以MXNet為工具講解了算法實現的具體細節。輔以大量簡潔的代碼,助你從零基礎開始實現深度學習算法。
全書共12章,分為4個部分:
第一部分 準備篇(第1~2章)
介紹了MXNet的發展、優勢、預備知識、各種深度學習框架的對比,以及開發環境的搭建,包括Docker的使用。
第二部分 基礎篇(第3~7章)
詳細講解了MXNet主要模塊的使用和原理,如MXNet的數據讀取、數據增強操作、常用網絡層的含義及使用、常見網絡結構的設計思想、模型訓練相關的參數配置等。
第三部分 實戰篇(第8~10章)
以圖像分類、目標檢測、圖像分割這三個常用領域為例演示瞭如何通過MXNet實現算法訓練和模型測試,同時還結合MXNet的接口詳細講解了算法實現的細節。
第四部分 擴展篇(第11~12章)
主要介紹了基於動態圖構建網絡結構的Gluon接口,以及MXNet專門為電腦視覺任務推出的深度學習庫GluonCV。
機器學習是人工智能領域中非常重要的一個研究方向,而深度學習作為機器學習的重要組成部分,伴隨著近幾年數據規模的增長和計算力的提升而備受關註。深度學習框架的快速發展大大降低了算法的入門門檻,越來越多的深度學習從業者能夠通過這些框架實現算法並應用到生活場景中,讓我們的生活更加智能和便捷。
通過閱讀本書,你將學到:
MXNet、TensorFlow、Pytorch、Caffe等深度學習框架的差異
MXNet框架各主要模塊的技術原理和應用實踐
MXNet在圖像分類、目標檢測、圖像分割中的應用,以及相關算法的訓練、模型測試和實現細節
基於動態圖構建網絡結構的Gluon接口
MXNet專門為電腦視覺任務推出的深度學習庫GluonCV
從零開始實現深度學習和電腦視覺算法的方法