有了多拉A夢翻譯年糕誰還要找翻譯社?人人都可以當口譯哥!
旅遊網紅用手機環遊世界溝通無礙!
當Google翻譯像空氣一樣自然的存在時,我們仿佛忘了機器翻譯走了幾百年,篳路藍縷有多麼的艱辛。身為使用者在享受這些科技的成果時,技術人員則更好奇些神奇應用底層的科學是如何發展出來的。熟悉史丹佛CS224n NLP課程的人,一定對大師Chris Manning對機器翻譯的重點十分讚嘆。本書就是堪比大師NLP和機器翻譯的真正鉅作。從機器翻譯的歷史、數學原理、理論細節、實作理論、參考資源、最新發展、從最細節到最宏觀的高度都放入書中。NLP是AI上皇冠上的一個明珠,機器翻譯更是最能展現NLP技術的極緻精華。從事NLP的技術人員、資料科學家、神經網路演算法科學家,如果想要真正進入NLP的世界,本書將會是20年來最重要,最完整、最能精進技術的一個重要提升。
本書特色
◎機器翻譯簡介
說明了從理性主義一直進入到資料主義的過程。接下來說明統計語言建模的基礎,進一步進入詞法語法分析的原理,其中並穿插了翻譯品質的評鑑標準。
◎統計機器翻譯
介紹了以詞、扭曲度、繁衍度、短語、句法為基礎的機器翻譯原理及實作。
◎近代機器翻譯的新世代 – 神經機器翻譯
介紹了神經網路及神經語言的建模、循環神經網路模型、卷積神經網路模型及自注意力機制的模型。
◎神經翻譯系統的細節
包括模型訓練及最佳化,模型的推論,更有針對神經網路系統的結構精進,以及使用低資源的神經網路(如資料蒸餾),以及多模態、多層次的機器翻譯,也介紹了新一代神經網路的應用及發展。
本書技術重點
✪理性主義及資料主義
✪統計語言建議
✪詞法/語法分析,以機率圖/分類器模型
✪科學方法評估翻譯品質
✪以詞、扭曲度/繁衍度、短語、句法模型的翻譯方法
✪Google大殺器:神經機器翻譯建模
✪循環神經網路模型/注意力機制,卷積神經網路模型
✪Transformer,自注意力機制
✪神經網路翻譯模型訓練/推論/結構最佳化
✪小型裝置上的神經網路機器翻譯
✪多模態/多層次機器翻譯
✪當代機器翻譯的應用及佈署
作者簡介:
肖桐
博士,東北大學教授、博士生導師,東北大學計算機學院人工智能係系主任,
東北大學自然語言處理實驗室主任,小牛翻譯(NiuTrans)聯合創始人。
於東北大學計算機專業獲得博士學位。
2006-2009年赴日本富士施樂、微軟亞洲研究院訪問學習,
並於2013一2014年赴英國劍橋大學開展博士後研究。
主要研究領域包括自然語言處理、機器學習等。
在國內外相關領域高水平會議及期刊上發表學術論文70餘篇。
作為項目技術負責人,成功研發了NiuTrans、NiuTensor等開源系統,
在WMT、CCMT/CWMT、NTCIR等國內外評測中多次獲得冠軍。
2014年獲得中國中文信息學會首屆優秀博士論文提名獎,
2016年獲得中國中文信息學會“錢偉長中文信息處理科學技術獎”一等獎。
任ACL、EMNLP、TACL等國際著名會議及期刊的領域主席和常駐審稿人。
朱靖波
博士,東北大學教授、博士生導師,小牛翻譯創始人。 於東 北大學計算機專業獲得博士學位,曾在香港城市大學 (2004-2005年)和美國南加州大學ISI(2006-2007 年)開展訪問研究。 從1992年開始,專注於語言分析和機器 翻譯技術研究工作,在國內外高水平會議及期刊上發表學術 論文200餘篇,2005年入選國家教育部新世紀優秀人才計 劃,2016年獲得中國中文資訊學會"錢偉長中文資訊處理科 學技術獎"一等獎。