轟動程式圈3大AI影像辨識利器
從收集資料、圖片擷取、建立標籤、訓練模型
到智慧影像辨識的全面進化實戰!
人工智慧(Artificial Intelligence)應用基本上可分五大層面:時間序列、圖像處理、音訊處理、自然語言處理以及動態影像處理,其中與「智慧影像」相關者就佔了兩大領域。智慧影像是透過電腦視覺技術,從中學習人類的視覺辨識能力,並自動判讀影像中的關鍵資訊,目前被大量使用在圖像辨識、人臉識別、物體動作捕捉、光學文字識別...等,是人工智慧最為廣泛的應用之一。
在這個領域的研究中有許多功能強大的工具,如OpenCV、Yolo與dlib,但許多使用者卻不知如何收集資料、建立標籤,更不知道如何訓練模型,進而達成智慧影像辨識的結果!本書將引領讀者運用自己的資料,透過本機與雲端的資源,以目前主流技術進行自有模型的訓練來完成實際可用的智慧影像應用。
挑戰智慧影像最佳學習地圖,
結合本機與雲端應用,
真正深入AI影像辨識核心!
■掌握智慧影像的技術特性與主流的應用模組,涵蓋OpenCV、Pillow、Yolo與dlib。
■根據不同模組特性介紹其資料來源的收集方式,除了一般土法煉鋼的徒手拍攝影像,也能利用Kaggle資料庫進行下載,或是利用動態影片進行大量圖片的擷取,再運用自動批次的方式進行圖片整理與特徵標記。
■當本機在訓練模型時發生記憶體不足、效能不夠等問題時,使用Google專為機器學習而生的Colab雲端服務來訓練自己的模型。
■集結最具代表性的實務應用主題,包括人臉辨識、口罩人臉辨識、車牌辨識、車流統計…等專題,在真實的情況中體驗智慧影像的應用,並擁有開發能力。
■針對OpenCV與Pillow影像處理特別提供入門影音輔助教學,加速學習效率。
書附超值學習資源:範例程式檔/100分鐘OpenCV與Pillow影像處理入門影音教學