你要聽特斯拉馬斯克的或是臉書祖克伯的?
前者認為人工智慧(AI)會毁滅人類,後者說不會!
其實你應聽Google的,
它提供平台讓中小企業也可以搭上人工智慧的特快車!
將衝擊世界的人工智慧類型基本上是指會自己學習的電腦,也就是所謂的機器學習(Machine Learning)及深度學習(Deep learning),而非過去大家習慣的電腦依程式行事。前者是指機器自己由大量資料中,得出某結論,如給電腦一堆貓的圖片,他會自己替貓做定義,進而由一張被切割的照片中,判斷那是不是貓。而深度學習則是電腦自行處理多層結構的訊息,而進行判讀。
人工智慧用5000部影片,就可以自己學會讀唇語!
曾有研究單位利用「深度學習」學習唇語的判讀,他們將英國BBC電視頻道的多個節目系列、合計約五千小時的影片做為學習的資料。學習後的電腦,在兩百支影片測驗組合中,光靠唇部動作便成功解讀出大約百分之五十的單字。而即使是在法庭上擁有十年以上經驗的唇語術專家,在相同的測驗中也只能判讀四分之一左右的單字。
電腦具備自主學習及判斷能力的事實將對人類社會產生重大衝擊,本書不只以一般人能理解的方式說明人工智慧在技術方面的進展,更以大量的實例,說明目前全球各種規模的企業如何利用會「學習」的電腦,來改變企業的運作。例如客戶服務的工作,原本極為依靠人力,但是,現在只要投入大量過去的QA,電腦會自己學會如何對應客戶;如語文的翻譯,電腦也可以自己由大量的翻譯資訊中學習,讓翻譯的品質提升。
善用人工智慧技術的企業,將在企業的經營上(至少成本的控制上),取得領先。問題是人工智慧的發展是否有很高的技術門檻?阻擋一般的中小企業於門外?其實不然。
中小企業也可以利用Google平台提供的應用程式介面,發展自己的深度學習運用
谷歌在其雲端服務「Google Cloud Platform(GCP)」中,將谷歌研究開發至今的深度學習成果透過兩種方式開放一般大眾使用(Google目前將人工智慧用在公司一千種服務以上):一種是將機器學習訓練完畢的模型,以應用程式介面 (Application Programming Interface;API)方式提供服務。另一種是提供機器學習程式庫「開源機器學習系統(Tensor Flow)」。
應用程式介面(API)一般是指能將擁有特定機能的電腦程式由外部程式叫出使用的介面。透過應用程式介面與電腦程式連結,就可以直接利用其功能。
谷歌將許多不同種類具有「機器學習」或是「深度學習」能力的「模型」放在「谷歌雲端平台(GCP)」。中小企業可以利用應用程式介面,直接利用其功能。而這些「模型」已經經過基本的「訓練」,因此使用者只要提供少量的資料,就可以達成學習的目的。
因為有了應用程式介面(API)的提供,使得「機器學習」與「深度學習」為一般企業所用的門檻大幅降低了。只需以程式介面(API)程式將「模型」叫出,就能使用圖像辨識與語音辨識的最新成果,真的很方便。
不過另一方面,許多太專業的運用,如人體器官病徵的辨識或是機械故障的預兆判斷等,無法以應用程式介面(API)套用現有的「模型」。谷歌所準備的機器學習程式庫「開源機器學習系統 TensorFlow」將派上用場。使用者可以下載程式,自行發展所需要的功能。「使用TensorFlow最大的好處,是只要以Python語言寫出簡單的程式碼,就能運用深度學習」。
本書不只告訴你人工智慧是什麼?將改變什麼?更告訴你可以做什麼,讓公司保持在科技的浪潮尖端。
本書特色
從定義到駕御:讓你徹底搞懂將對人類產生鉅大影響的科技
本書在觀察大量企業的運用後,在第五章《架構活用篇》提出導入的深度學習的具體架構,讓讀者不只能懂,也能縮短運用時摸索的時間。本書發現人工智慧(機器學習、深度學習)的風潮席捲全球,不過其在企業運用的目的不外以下幾種:1、刪減成本。2、提高附加價值創造出新的商機。3、提升創意性。而在觀察幾百家企業的操作後,發現以刪減成本的目的最容易產生效果。
用案例讓讀者完全理解
對沒有技術背景的民眾而言,最關心的是人工智慧(機器學習、深度學習)要如何運用,本書以實際的案例說明相關問題:
■ 安藤HAZAMA――用以判斷隧道工程之岩盤硬度
為了建設隧道工程時能兼具安全與效率,安藤HAZAMA與日本系統軟體共同開發的「隧道開挖面AI自動評價系統」。將挖掘隧道時最尖端之開挖面照片輸入後,該系統就會自動評價其岩盤的硬度、脆性等工學特性。透過人工智慧帶來的岩盤工學特性評價自動化,即使沒有專家或資深技師在場,也能給予正確的判斷。
在學習之際,將五百張左右的相片進行分割,製作成五萬張的相片資料。結合相片岩石所代表的彈性波速度,一起讓機器學習的結果,在拍攝開挖面相片後,就能得到彈性波的速度值。新系統在從開挖面的相片辨識其相對應的彈性波速度上,正確率大約有百分之八十五。
■ AUCNET IBS――從車輛相片就能鎖定款式
深度學習特別適用於圖片的識別。從事支援中古車等業者間交易的AUCNET(位於東京都港區)系統開發子公司之AUCNET IBS就是圖片識別運用的例子。該公司運用深度學習技術,開發了能自動將車輛不同部位照片歸類上傳到網站的系統「konpeki(紺碧)」。二〇一六年十一月集團旗下的中古車經銷商FLEX(東京都港區)採用了這個系統,提升網站上資訊登錄作業的效率。
中古車經銷商經常需要為購入的中古車拍攝許多相片、進行上傳到自家網站或資訊網站的作業。車子的左斜前方、右斜前方、右側、左側、後方、還有車內的前座及後座、儀表板、導航等……。這些相片如果由店員手工整理的話,大概要花個五分鐘左右。Konpeki系統只要經銷商店員將拍攝的相片登錄,就立刻能自動依部位別分類,輕鬆地上傳至中古車資訊網站。
它將車輛外部區分為十八種、内部區分為十二種。它也會將包含車輛的相片、但並非銷售對象的圖像(如廣告)區分出來。甚至還能鎖定某品牌、車名、款式,顯示平均銷售價格帶。
「konpeki(紺碧)」系統的開發便是採用了谷歌的「谷歌雲端平台(GCP)」上為了開發深度學習模型的程式庫「開源機器學習系統(Tensor Flow)」、讓機器學習大量圖像資料而成。
■ 以少量的訓練資料構築出車輛台數檢測的系統
Aerosense與大數據的BrainPad公司共同合作、運用了深度學習技術的作法。開發了從空拍圖像中測出停車車輛數的系統。先從實驗結果來看的話,使用了深度學習的空拍圖辨識汽車模型,在顯示了一百一十六輛汽車的測試圖資料中,測岀結果為一百二十二輛。
Aerosense的汽車辨識模型,其特點在於其從空拍圖辨識汽車用的深度學習模型,並非是從零開始打造的。研發人員說明:「若要製作專用的模型,將需要大量的訓練資料。即使有一萬張也不夠吧!這次是運用了現有的模型,大約只有一百三十張的少量訓練資料,就顯示出其高精確度,很有價值。」
在深度學習模型的開發上,活用了谷歌的深度學習程式庫「TensorFlow」。利用TensorFlow中名為「Inception-V3」之一般圖像辨識模型,從圖像資料中製作抽取了特徵值的向量。此時,使用約一百三十張的汽車空拍照作為訓練資料。抽取了特徵值的向量,再以一種名為SVM(支援向量機;Support Vector Machine)的機器學習進行學習,得出結果。
結合500家企業的導入經驗,系統化說明著手運用深度學習的方法
作者輔導了500家以上企業導入深度學習於工作之中,他用資料×目的的矩陣,描繪出活用展望圖,協助讀者理清頭緒,讓公司縮短導入摸索的時間。