大數據分析是許多傳統產業的主要驅動力,例如:金融、醫療和能源等等。視覺資料分析(Visual data analysis)和電腦視覺(Computer Vision)則是這場資料革命的一部分。近年來,它們的發展漸趨成熟,在自主導航、遊戲和製造業等領域,創造了許多新穎又令人振奮的應用程式。
本書將帶領讀者建立強大且獨特的電腦視覺應用程式。每一章將從一個專案展開,並深入OpenCV的某個重要面向,例如:人臉辨識、圖像目標追蹤、3D重建框架和機器學習等等。讀者將學會如何使用深度類神經網路,並將AI加進應用程式之中。
本書的專案將幫助讀者學習建立各種可運作的prototype,並熟悉各種OpenCV 3的新功能。
你能夠從本書學習到:
・執行基本的影像處理操作,並將圖像卡通化
・原生地建置OpenCV專案,並為樹莓派進行交叉編譯,建立強大的微尺度偵測器
・使用OpenCV 3新的運動恢復結構功能,從靜止的相機圖像中重建3D幾何
・建立圖形識別演算法,並預測圖像是否包含汽車車牌
・使用POSIT進行6自由度頭部姿態估計
・使用深度卷積類神經網路建立人臉辨識演算法
作者簡介:
▌Daniel Lélis Baggio
他在聖保羅的InCor(Instituto do Coração–Heart Institute)進行血管內超音波影像分割。從那時候起,他專注於GPGPU 的應用,並將分割演算法(segmentation algorithm)移植到NVIDIA 的CUDA 上。他也參與一個名為ehci 的計畫(http://code.google.com/p/ ehci/),致力於「自然使用者介面組」的「6 自由度頭部追蹤」(6degrees of freedom head tracking )。現在他在巴西空軍工作。
▌Shervin Emami
OpenCV 提供了Shervin 一家人溫飽,為了回饋OpenCV,他開始定期在論壇上提供建議,並在自己的網站發布免費的OpenCV 教學(http://www.shervinemami.info/ openCV.html)。2011 年,他聯絡其他免費OpenCV 網站的站長來撰寫這本書。他也開始在NVIDIA 進行「行動裝置上的電腦視覺最佳化」,與官方OpenCV 開發者密切合作,開發Android 上的OpenCV 最佳化版本。2012 年,他還加入了Khronos OpenVL 委員會,為行動裝置上的「電腦視覺硬體加速」建立標準,並成為OpenCV 未來的基礎。
▌David Millán Escrivá
David 擁有超過10 年的IT 工作經驗,在電腦視覺、電腦圖學和模式辨識領域有豐富的經驗,從事過許多不同的專案和新創公司,並應用他在「電腦視覺」、「光學字元辨識」和「擴增實境」的知識。他是DamilesBlog 的作者 (http://blog.damiles.com),發表了許多關於「OpenCV」、「一般電腦視覺」和「光學字元辨識演算法」的研究和教學。David 也審校了Lee Phillips 所寫的《gnuPlot Cookbook》一書(由Packt 出版)。
▌Khvedchenia Ievgen
是來自烏克蘭的電腦視覺專家。他的職業生涯始於為「哈曼國際工業公司」研發一種以攝影機為基礎的「駕駛輔助系統」。隨後,他開始在ESG 擔任電腦視覺顧問。如今,他是一名專注於「擴增實境應用程式」的獨立開發者。Ievgen 是「電腦視覺演講部落格的作者(http://computervisi-talks.com),他在部落格上發表有關「電腦視覺」和「擴增實境」的研究和教學。
▌Jason Saragih
Saragih 博士在電腦視覺領域做出了許多貢獻,特別是在「可變形模型的註冊和建模」的領域。他是DeMoLib 和FaceTracker 的作者,而這兩個科學界廣泛使用的「非營利開源函式庫」都使用了通用的電腦視覺函式庫,包括OpenCV。
▌Roy Shilkrot
Roy 在新創公司和企業擁有超過7 年的軟體工程師經驗。在加入麻省理工學院Media Laboratory 擔任研究助理之前, 他曾在電信解決方案提供商Comverse 的Innovation Laboratory 擔任技術策略師。他還涉足諮詢業,也曾在微軟Redmond 研究院實習。