內容簡介
原書名:グーグルに学ぶディープラーニング:人工知能ブームの牽引役その仕組みをやさしく解説
中文書名:Google教你深度學習:中小企業如何利用會自己學習的電腦?
內容簡介
你要聽特斯拉馬斯克的或是臉書祖克伯的?
前者認為人工智慧(AI)會毁滅人類,後者說不會!
其實你應聽Google的,
它提供平台讓中小企業也可以搭上人工智慧的特快車!
將衝擊世界的人工智慧類型基本上是指會自己學習的電腦,也就是所謂的機器學習(Machine Learning)及深度學習(Deep learning),而非過去大家習慣的電腦依程式行事。前者是指機器自己由大量資料中,得出某結論,如給電腦一堆貓的圖片,他會自己替貓做定義,進而由一張被切割的照片中,判斷那是不是貓。而深度學習則是電腦自行處理多層結構的訊息,而進行判讀。
人工智慧用5000部影片,就可以自己學會讀唇語!
曾有研究單位利用「深度學習」學習唇語的判讀,他們將英國BBC電視頻道的多個節目系列、合計約五千小時的影片做為學習的資料。學習後的電腦,在兩百支影片測驗組合中,光靠唇部動作便成功解讀出大約百分之五十的單字。而即使是在法庭上擁有十年以上經驗的唇語術專家,在相同的測驗中也只能判讀四分之一左右的單字。
電腦具備自主學習及判斷能力的事實將對人類社會產生重大衝擊,本書不只以一般人能理解的方式說明人工智慧在技術方面的進展,更以大量的實例,說明目前全球各種規模的企業如何利用會「學習」的電腦,來改變企業的運作。例如客戶服務的工作,原本極為依靠人力,但是,現在只要投入大量過去的QA,電腦會自己學會如何對應客戶;如語文的翻譯,電腦也可以自己由大量的翻譯資訊中學習,讓翻譯的品質提升。
善用人工智慧技術的企業,將在企業的經營上(至少成本的控制上),取得領先。問題是人工智慧的發展是否有很高的技術門檻?阻擋一般的中小企業於門外?其實不然。
中小企業也可以利用Google平台提供的應用程式介面,發展自己的深度學習運用
谷歌在其雲端服務「Google Cloud Platform(GCP)」中,將谷歌研究開發至今的深度學習成果透過兩種方式開放一般大眾使用(Google目前將人工智慧用在公司一千種服務以上):一種是將機器學習訓練完畢的模型,以應用程式介面 (Application Programming Interface;API)方式提供服務。另一種是提供機器學習程式庫「開源機器學習系統(Tensor Flow)」。
應用程式介面(API)一般是指能將擁有特定機能的電腦程式由外部程式叫出使用的介面。透過應用程式介面與電腦程式連結,就可以直接利用其功能。
谷歌將許多不同種類具有「機器學習」或是「深度學習」能力的「模型」放在「谷歌雲端平台(GCP)」。中小企業可以利用應用程式介面,直接利用其功能。而這些「模型」已經經過基本的「訓練」,因此使用者只要提供少量的資料,就可以達成學習的目的。
因為有了應用程式介面(API)的提供,使得「機器學習」與「深度學習」為一般企業所用的門檻大幅降低了。只需以程式介面(API)程式將「模型」叫出,就能使用圖像辨識與語音辨識的最新成果,真的很方便。
不過另一方面,許多太專業的運用,如人體器官病徵的辨識或是機械故障的預兆判斷等,無法以應用程式介面(API)套用現有的「模型」。谷歌所準備的機器學習程式庫「開源機器學習系統 TensorFlow」將派上用場。使用者可以下載程式,自行發展所需要的功能。「使用TensorFlow最大的好處,是只要以Python語言寫出簡單的程式碼,就能運用深度學習」。
本書不只告訴你人工智慧是什麼?將改變什麼?更告訴你可以做什麼,讓公司保持在科技的浪潮尖端。
本書特色
從定義到駕御:讓你徹底搞懂將對人類產生鉅大影響的科技
本書在觀察大量企業的運用後,在第五章《架構活用篇》提出導入的深度學習的具體架構,讓讀者不只能懂,也能縮短運用時摸索的時間。本書發現人工智慧(機器學習、深度學習)的風潮席捲全球,不過其在企業運用的目的不外以下幾種:1、刪減成本。2、提高附加價值創造出新的商機。3、提升創意性。而在觀察幾百家企業的操作後,發現以刪減成本的目的最容易產生效果。
用案例讓讀者完全理解
對沒有技術背景的民眾而言,最關心的是人工智慧(機器學習、深度學習)要如何運用,本書以實際的案例說明相關問題:
■ 安藤HAZAMA――用以判斷隧道工程之岩盤硬度
為了建設隧道工程時能兼具安全與效率,安藤HAZAMA與日本系統軟體共同開發的「隧道開挖面AI自動評價系統」。將挖掘隧道時最尖端之開挖面照片輸入後,該系統就會自動評價其岩盤的硬度、脆性等工學特性。透過人工智慧帶來的岩盤工學特性評價自動化,即使沒有專家或資深技師在場,也能給予正確的判斷。
在學習之際,將五百張左右的相片進行分割,製作成五萬張的相片資料。結合相片岩石所代表的彈性波速度,一起讓機器學習的結果,在拍攝開挖面相片後,就能得到彈性波的速度值。新系統在從開挖面的相片辨識其相對應的彈性波速度上,正確率大約有百分之八十五。
■ AUCNET IBS――從車輛相片就能鎖定款式
深度學習特別適用於圖片的識別。從事支援中古車等業者間交易的AUCNET(位於東京都港區)系統開發子公司之AUCNET IBS就是圖片識別運用的例子。該公司運用深度學習技術,開發了能自動將車輛不同部位照片歸類上傳到網站的系統「konpeki(紺碧)」。二〇一六年十一月集團旗下的中古車經銷商FLEX(東京都港區)採用了這個系統,提升網站上資訊登錄作業的效率。
中古車經銷商經常需要為購入的中古車拍攝許多相片、進行上傳到自家網站或資訊網站的作業。車子的左斜前方、右斜前方、右側、左側、後方、還有車內的前座及後座、儀表板、導航等……。這些相片如果由店員手工整理的話,大概要花個五分鐘左右。Konpeki系統只要經銷商店員將拍攝的相片登錄,就立刻能自動依部位別分類,輕鬆地上傳至中古車資訊網站。
它將車輛外部區分為十八種、内部區分為十二種。它也會將包含車輛的相片、但並非銷售對象的圖像(如廣告)區分出來。甚至還能鎖定某品牌、車名、款式,顯示平均銷售價格帶。
「konpeki(紺碧)」系統的開發便是採用了谷歌的「谷歌雲端平台(GCP)」上為了開發深度學習模型的程式庫「開源機器學習系統(Tensor Flow)」、讓機器學習大量圖像資料而成。
■ 以少量的訓練資料構築出車輛台數檢測的系統
Aerosense與大數據的BrainPad公司共同合作、運用了深度學習技術的作法。開發了從空拍圖像中測出停車車輛數的系統。先從實驗結果來看的話,使用了深度學習的空拍圖辨識汽車模型,在顯示了一百一十六輛汽車的測試圖資料中,測岀結果為一百二十二輛。
Aerosense的汽車辨識模型,其特點在於其從空拍圖辨識汽車用的深度學習模型,並非是從零開始打造的。研發人員說明:「若要製作專用的模型,將需要大量的訓練資料。即使有一萬張也不夠吧!這次是運用了現有的模型,大約只有一百三十張的少量訓練資料,就顯示出其高精確度,很有價值。」
在深度學習模型的開發上,活用了谷歌的深度學習程式庫「TensorFlow」。利用TensorFlow中名為「Inception-V3」之一般圖像辨識模型,從圖像資料中製作抽取了特徵值的向量。此時,使用約一百三十張的汽車空拍照作為訓練資料。抽取了特徵值的向量,再以一種名為SVM(支援向量機;Support Vector Machine)的機器學習進行學習,得出結果。
結合500家企業的導入經驗,系統化說明著手運用深度學習的方法
作者輔導了500家以上企業導入深度學習於工作之中,他用資料×目的的矩陣,描繪出活用展望圖,協助讀者理清頭緒,讓公司縮短導入摸索的時間。
中文書名:Google教你深度學習:中小企業如何利用會自己學習的電腦?
內容簡介
你要聽特斯拉馬斯克的或是臉書祖克伯的?
前者認為人工智慧(AI)會毁滅人類,後者說不會!
其實你應聽Google的,
它提供平台讓中小企業也可以搭上人工智慧的特快車!
將衝擊世界的人工智慧類型基本上是指會自己學習的電腦,也就是所謂的機器學習(Machine Learning)及深度學習(Deep learning),而非過去大家習慣的電腦依程式行事。前者是指機器自己由大量資料中,得出某結論,如給電腦一堆貓的圖片,他會自己替貓做定義,進而由一張被切割的照片中,判斷那是不是貓。而深度學習則是電腦自行處理多層結構的訊息,而進行判讀。
人工智慧用5000部影片,就可以自己學會讀唇語!
曾有研究單位利用「深度學習」學習唇語的判讀,他們將英國BBC電視頻道的多個節目系列、合計約五千小時的影片做為學習的資料。學習後的電腦,在兩百支影片測驗組合中,光靠唇部動作便成功解讀出大約百分之五十的單字。而即使是在法庭上擁有十年以上經驗的唇語術專家,在相同的測驗中也只能判讀四分之一左右的單字。
電腦具備自主學習及判斷能力的事實將對人類社會產生重大衝擊,本書不只以一般人能理解的方式說明人工智慧在技術方面的進展,更以大量的實例,說明目前全球各種規模的企業如何利用會「學習」的電腦,來改變企業的運作。例如客戶服務的工作,原本極為依靠人力,但是,現在只要投入大量過去的QA,電腦會自己學會如何對應客戶;如語文的翻譯,電腦也可以自己由大量的翻譯資訊中學習,讓翻譯的品質提升。
善用人工智慧技術的企業,將在企業的經營上(至少成本的控制上),取得領先。問題是人工智慧的發展是否有很高的技術門檻?阻擋一般的中小企業於門外?其實不然。
中小企業也可以利用Google平台提供的應用程式介面,發展自己的深度學習運用
谷歌在其雲端服務「Google Cloud Platform(GCP)」中,將谷歌研究開發至今的深度學習成果透過兩種方式開放一般大眾使用(Google目前將人工智慧用在公司一千種服務以上):一種是將機器學習訓練完畢的模型,以應用程式介面 (Application Programming Interface;API)方式提供服務。另一種是提供機器學習程式庫「開源機器學習系統(Tensor Flow)」。
應用程式介面(API)一般是指能將擁有特定機能的電腦程式由外部程式叫出使用的介面。透過應用程式介面與電腦程式連結,就可以直接利用其功能。
谷歌將許多不同種類具有「機器學習」或是「深度學習」能力的「模型」放在「谷歌雲端平台(GCP)」。中小企業可以利用應用程式介面,直接利用其功能。而這些「模型」已經經過基本的「訓練」,因此使用者只要提供少量的資料,就可以達成學習的目的。
因為有了應用程式介面(API)的提供,使得「機器學習」與「深度學習」為一般企業所用的門檻大幅降低了。只需以程式介面(API)程式將「模型」叫出,就能使用圖像辨識與語音辨識的最新成果,真的很方便。
不過另一方面,許多太專業的運用,如人體器官病徵的辨識或是機械故障的預兆判斷等,無法以應用程式介面(API)套用現有的「模型」。谷歌所準備的機器學習程式庫「開源機器學習系統 TensorFlow」將派上用場。使用者可以下載程式,自行發展所需要的功能。「使用TensorFlow最大的好處,是只要以Python語言寫出簡單的程式碼,就能運用深度學習」。
本書不只告訴你人工智慧是什麼?將改變什麼?更告訴你可以做什麼,讓公司保持在科技的浪潮尖端。
本書特色
從定義到駕御:讓你徹底搞懂將對人類產生鉅大影響的科技
本書在觀察大量企業的運用後,在第五章《架構活用篇》提出導入的深度學習的具體架構,讓讀者不只能懂,也能縮短運用時摸索的時間。本書發現人工智慧(機器學習、深度學習)的風潮席捲全球,不過其在企業運用的目的不外以下幾種:1、刪減成本。2、提高附加價值創造出新的商機。3、提升創意性。而在觀察幾百家企業的操作後,發現以刪減成本的目的最容易產生效果。
用案例讓讀者完全理解
對沒有技術背景的民眾而言,最關心的是人工智慧(機器學習、深度學習)要如何運用,本書以實際的案例說明相關問題:
■ 安藤HAZAMA――用以判斷隧道工程之岩盤硬度
為了建設隧道工程時能兼具安全與效率,安藤HAZAMA與日本系統軟體共同開發的「隧道開挖面AI自動評價系統」。將挖掘隧道時最尖端之開挖面照片輸入後,該系統就會自動評價其岩盤的硬度、脆性等工學特性。透過人工智慧帶來的岩盤工學特性評價自動化,即使沒有專家或資深技師在場,也能給予正確的判斷。
在學習之際,將五百張左右的相片進行分割,製作成五萬張的相片資料。結合相片岩石所代表的彈性波速度,一起讓機器學習的結果,在拍攝開挖面相片後,就能得到彈性波的速度值。新系統在從開挖面的相片辨識其相對應的彈性波速度上,正確率大約有百分之八十五。
■ AUCNET IBS――從車輛相片就能鎖定款式
深度學習特別適用於圖片的識別。從事支援中古車等業者間交易的AUCNET(位於東京都港區)系統開發子公司之AUCNET IBS就是圖片識別運用的例子。該公司運用深度學習技術,開發了能自動將車輛不同部位照片歸類上傳到網站的系統「konpeki(紺碧)」。二〇一六年十一月集團旗下的中古車經銷商FLEX(東京都港區)採用了這個系統,提升網站上資訊登錄作業的效率。
中古車經銷商經常需要為購入的中古車拍攝許多相片、進行上傳到自家網站或資訊網站的作業。車子的左斜前方、右斜前方、右側、左側、後方、還有車內的前座及後座、儀表板、導航等……。這些相片如果由店員手工整理的話,大概要花個五分鐘左右。Konpeki系統只要經銷商店員將拍攝的相片登錄,就立刻能自動依部位別分類,輕鬆地上傳至中古車資訊網站。
它將車輛外部區分為十八種、内部區分為十二種。它也會將包含車輛的相片、但並非銷售對象的圖像(如廣告)區分出來。甚至還能鎖定某品牌、車名、款式,顯示平均銷售價格帶。
「konpeki(紺碧)」系統的開發便是採用了谷歌的「谷歌雲端平台(GCP)」上為了開發深度學習模型的程式庫「開源機器學習系統(Tensor Flow)」、讓機器學習大量圖像資料而成。
■ 以少量的訓練資料構築出車輛台數檢測的系統
Aerosense與大數據的BrainPad公司共同合作、運用了深度學習技術的作法。開發了從空拍圖像中測出停車車輛數的系統。先從實驗結果來看的話,使用了深度學習的空拍圖辨識汽車模型,在顯示了一百一十六輛汽車的測試圖資料中,測岀結果為一百二十二輛。
Aerosense的汽車辨識模型,其特點在於其從空拍圖辨識汽車用的深度學習模型,並非是從零開始打造的。研發人員說明:「若要製作專用的模型,將需要大量的訓練資料。即使有一萬張也不夠吧!這次是運用了現有的模型,大約只有一百三十張的少量訓練資料,就顯示出其高精確度,很有價值。」
在深度學習模型的開發上,活用了谷歌的深度學習程式庫「TensorFlow」。利用TensorFlow中名為「Inception-V3」之一般圖像辨識模型,從圖像資料中製作抽取了特徵值的向量。此時,使用約一百三十張的汽車空拍照作為訓練資料。抽取了特徵值的向量,再以一種名為SVM(支援向量機;Support Vector Machine)的機器學習進行學習,得出結果。
結合500家企業的導入經驗,系統化說明著手運用深度學習的方法
作者輔導了500家以上企業導入深度學習於工作之中,他用資料×目的的矩陣,描繪出活用展望圖,協助讀者理清頭緒,讓公司縮短導入摸索的時間。
作者簡介
作者簡介
日經大數據
為「期許能善用資料制定成長戰略」的企業所撰寫的專業刊物。以採訪「大數據×人工智慧×物聯網(Internet of Things; IoT)」之活用事例為主,透過網站及月刊向定期訂閱者提供資訊。
譯者簡介
李青芬
輔仁大學日文系畢。自幼在祖母啟蒙下,對日本文化深感興趣,自修數年。大學二年級時取得日文檢定一級,目前於商界服務。時時刻刻透過文字推敲感受日文的醍醐味。著作有《一個人用日語一直聊一直聊》、《日本國民用語大全集》、《史上最強日語單字》(合譯)、《史上最強韓語單字》(合譯)、《一天看完的日文書信》、《NEW TOEIC 新多益990滿分王》等(均由國際學村出版)。《內容的力量》、《男女有別說話術》(均由財經傳訊出版)
日經大數據
為「期許能善用資料制定成長戰略」的企業所撰寫的專業刊物。以採訪「大數據×人工智慧×物聯網(Internet of Things; IoT)」之活用事例為主,透過網站及月刊向定期訂閱者提供資訊。
譯者簡介
李青芬
輔仁大學日文系畢。自幼在祖母啟蒙下,對日本文化深感興趣,自修數年。大學二年級時取得日文檢定一級,目前於商界服務。時時刻刻透過文字推敲感受日文的醍醐味。著作有《一個人用日語一直聊一直聊》、《日本國民用語大全集》、《史上最強日語單字》(合譯)、《史上最強韓語單字》(合譯)、《一天看完的日文書信》、《NEW TOEIC 新多益990滿分王》等(均由國際學村出版)。《內容的力量》、《男女有別說話術》(均由財經傳訊出版)
內容目錄
目錄
序章:深度學習將改變一切商務行為
深度學習因大數據得以展現實力
TOYOTA為美日所有小客車搭載通訊配備
在這個人工智慧引領技術革新的時代
中小企業也受惠於人工智慧
第一章 在入門之前:人工智慧、機器學習與深度學習有什麼不同?
深度學習是機器學習的一部分
機器學習並非靠人類寫的程式來運作
電腦發達使深度學習成為可能
人工智慧之拓展有如「研究的洪流」一般
從「手機優先」到「AI 優先」
第二章 入門:深度學習的架構
何謂機器學習「以外」的人工智慧
機器學習之基礎
即使是機器學習也有很多方式
類神經網絡是大腦神經構造
分類方式是電腦自學而來
以網路上的「遊樂場」來理解神經網路
監督式學習與強化學習
「AlphaGo」徹底活用了強化學習技術
第三章 Google事例篇:Google的深度學習活用事例
■ 放眼未來,愈發廣泛活用的深度學習
能以口語下指令的家庭用人工智慧管家
有辦法像人類對話般地溝通無礙嗎?
■ 支援自動駕駛的深度學習
用深度學習讓資訊中心大幅節能化
■ 超越人類之眼的精密判讀――圖像辨識能力
能自動分類照片的 「Google Photo」
電腦也會做夢嗎?「Deep Dream」實驗
創造出優秀藝術與音樂的「Magenta」
影片的辨識也沒問題!「唇語術勝過人類專家」
■ 理解文章內容的原文分析
能自動製作電子郵件回信備用內容的「Inbox」
過濾垃圾郵件的精密度也有長足進步
能讓企業資訊更易於被搜尋的「Google Springboard」
■ 只要說話就能與電腦溝通的「語音辨識」
邊對話邊支援人類的「Google Assistant」
能進行語音合成也能譜出鋼琴曲的 「Wave Net」
■ 讓跨越語言障礙成為可能的「機器翻譯」
透過類神經網路讓Google翻譯更進化
■ 能輕鬆使用深度學習成果的「機器學習API」
能活用客製化深度學習的「TensorFlow」
適合/不適合深度學習的領域
第四章 企業事例篇:國內漸漸開始採用深度學習達成業務效率化
■ 安藤HAZAMA――用以判斷隧道工程之岩盤硬度
以達到挖掘工程之自動最適化為展望
■ AUCNET IBS――從車輛照片到款式皆可判別
活用年度約五百萬台的中古車資料
因無法識別車子的方向而苦惱
對活化中古車交易的貢獻
■ Aerosense活用了空照圖資料庫
以少量的訓練資料構築出車輛台數檢測系統
開發能提升測量效率的標識
■ 樂桃航空利用語音辨識API能全天候二十四小時掌握航班動態
人與人工智慧的分工合作
■ 三井住友FG檢測非法交易的精確度大幅提升
導入使用於客服中心每個座位
資料本身不會有答案
第五章 架構活用篇:整理資料×目的,描繪出活用展望圖
■ 根據資料×目的之整理法
活用現有之圖像資料
語音資料主要用於客服中心
實務上先從成本縮減著手
■ 成功之應備常識及人才轉換
是否能畫出活用展開圖
需要的人才特質是?
機器學習商品化後,接下來具有特殊性的是⋯⋯
第六章 未來展望篇:邁向由深度學習解決問題的未來
訪問Google Cloud Machine Learning小組研究負責人- 李佳(Jia Li)
深度學習是技術革新的領頭羊
人間的優秀之處、演算法的研究仍有很大的進步空間
深度學習對資料「求知若渴」
解決現實世界的課題是AI研究主要目標 &
序章:深度學習將改變一切商務行為
深度學習因大數據得以展現實力
TOYOTA為美日所有小客車搭載通訊配備
在這個人工智慧引領技術革新的時代
中小企業也受惠於人工智慧
第一章 在入門之前:人工智慧、機器學習與深度學習有什麼不同?
深度學習是機器學習的一部分
機器學習並非靠人類寫的程式來運作
電腦發達使深度學習成為可能
人工智慧之拓展有如「研究的洪流」一般
從「手機優先」到「AI 優先」
第二章 入門:深度學習的架構
何謂機器學習「以外」的人工智慧
機器學習之基礎
即使是機器學習也有很多方式
類神經網絡是大腦神經構造
分類方式是電腦自學而來
以網路上的「遊樂場」來理解神經網路
監督式學習與強化學習
「AlphaGo」徹底活用了強化學習技術
第三章 Google事例篇:Google的深度學習活用事例
■ 放眼未來,愈發廣泛活用的深度學習
能以口語下指令的家庭用人工智慧管家
有辦法像人類對話般地溝通無礙嗎?
■ 支援自動駕駛的深度學習
用深度學習讓資訊中心大幅節能化
■ 超越人類之眼的精密判讀――圖像辨識能力
能自動分類照片的 「Google Photo」
電腦也會做夢嗎?「Deep Dream」實驗
創造出優秀藝術與音樂的「Magenta」
影片的辨識也沒問題!「唇語術勝過人類專家」
■ 理解文章內容的原文分析
能自動製作電子郵件回信備用內容的「Inbox」
過濾垃圾郵件的精密度也有長足進步
能讓企業資訊更易於被搜尋的「Google Springboard」
■ 只要說話就能與電腦溝通的「語音辨識」
邊對話邊支援人類的「Google Assistant」
能進行語音合成也能譜出鋼琴曲的 「Wave Net」
■ 讓跨越語言障礙成為可能的「機器翻譯」
透過類神經網路讓Google翻譯更進化
■ 能輕鬆使用深度學習成果的「機器學習API」
能活用客製化深度學習的「TensorFlow」
適合/不適合深度學習的領域
第四章 企業事例篇:國內漸漸開始採用深度學習達成業務效率化
■ 安藤HAZAMA――用以判斷隧道工程之岩盤硬度
以達到挖掘工程之自動最適化為展望
■ AUCNET IBS――從車輛照片到款式皆可判別
活用年度約五百萬台的中古車資料
因無法識別車子的方向而苦惱
對活化中古車交易的貢獻
■ Aerosense活用了空照圖資料庫
以少量的訓練資料構築出車輛台數檢測系統
開發能提升測量效率的標識
■ 樂桃航空利用語音辨識API能全天候二十四小時掌握航班動態
人與人工智慧的分工合作
■ 三井住友FG檢測非法交易的精確度大幅提升
導入使用於客服中心每個座位
資料本身不會有答案
第五章 架構活用篇:整理資料×目的,描繪出活用展望圖
■ 根據資料×目的之整理法
活用現有之圖像資料
語音資料主要用於客服中心
實務上先從成本縮減著手
■ 成功之應備常識及人才轉換
是否能畫出活用展開圖
需要的人才特質是?
機器學習商品化後,接下來具有特殊性的是⋯⋯
第六章 未來展望篇:邁向由深度學習解決問題的未來
訪問Google Cloud Machine Learning小組研究負責人- 李佳(Jia Li)
深度學習是技術革新的領頭羊
人間的優秀之處、演算法的研究仍有很大的進步空間
深度學習對資料「求知若渴」
解決現實世界的課題是AI研究主要目標 &