人工智慧起飛-工業技術與資訊月刊-出版品-新聞中心-工業技術研究院

:::

新聞中心

工業技術與資訊月刊

聯絡我們

出版日期：

觀念探索 Trend

人工智慧起飛

撰文／柏斯坦（Brian Bergstein）　譯／梁豫婷攝影／瑞特曼（Jonno Rattman）

焦點話題－人工智慧正夯

愈來愈多產業試圖應用人工智慧，這對科技的未來將造成什麼影響？

機器學習工具經過改良，處理技術價格更低廉，數據儲存成本大幅下滑，美國保險與金融公司USAA數據科學部門主任韋爾伯恩（Robert Welborn）說，2015年是機器學習正式商業化的一年。機器學習的突飛猛進加上美國保險與金融公司的大數據，發展了數十年的技術突然變得實用起來。

提到人工智慧，或許不會馬上聯想到保險、金融、製造、石油天然氣、汽車、醫療等產業，但隨著谷歌、百度等科技公司一路在人工智慧領域開疆闢土，愈來愈多產業開始思考應用人工智慧的可能性。

人工智慧商業化後會如何發展？又將如何改變各個產業？這正是本篇報導的焦點話題。

目前販售人工智慧軟體和服務的產業規模仍小。根據國際數據資訊IDC研究部主任舒布梅爾（Dave Schubmehl）計算，除了谷歌和臉書等為自己做研究的公司以外，去年銷售認知軟體平台公司的營收總額達10億美元，他預估到2020年會超過100億美元。彭博的數據則顯示，屏除IBM和Palantir Technology等少數大型企業，人工智慧市場多為新創公司，目前約有2,600家。

儘管模式辨識（pattern recognition）、自然語言處理（natural language processing）、影像辨識（image recognition）、假設生成（hypothesis generation）等各項技術進步神速，人工智慧還有很長的路要走。

美國保險與金融公司測試用人工智慧微調身份竊盜偵測系統，可謂應用人工智慧的先驅。韋爾伯恩表示，相較於傳統系統必須等到犯罪第二次發生才能辨識新的模式，使用人工智慧的系統會尋找不符合某顧客典型行為的模式，並在第一次就辨別出異常。此公司的另一測試計畫是為改善客服，使用了英特爾部門Saffron開發的人工智慧，模擬人腦做出連結的隨機性。此技術結合7,000種不同的因素，匹配各種客戶行為模式，有88%的機率能正確預測客戶下次會用何種方式聯絡美國保險與金融公司，用網路、電話或電郵，以及屆時會想要什麼服務。若沒有人工智慧，美國保險與金融公司系統的正確率只有50%，目前他們正在擴大此測試規模。

奇異公司用人工智慧改良精密的噴射引擎，結合電腦視覺的人工智慧與電腦輔助設計（CAD）繪圖、攝影機和遠紅外線偵測器的數據，以更有效偵測飛機引擎葉片裂縫和其他問題。

人工智慧亦促成新產品和新服務問世。運動裝備製造商Under Armour（UA）推出MyFitness Pal運動與熱量追蹤應用程式，與一億6,000萬名消費者保持密切聯繫。他們不僅幫客戶記錄運動成果，還與IBM的認知運算部門Watson合作，取得規律健身和營養的數據後，結合從研究結果和其他第三方蒐集而來的睡眠、活動、體能、營養資訊，教導人們如何達成自己的健身目標。

對於像美國保險與金融公司和UA這樣的公司，人工智慧不是電影裡的擬真機器人，而是不斷精進的工具。儘管有人畏懼人工智慧將全面取代人力，但其實人為判斷和回饋仍至關重要，才能持續改良機器學習系統。正如谷歌工程部副總裁詹南德雷亞（John Giannandrea）所說：「就算有一輛高科技的車，還是要人決定去哪裡。」

作者：伯恩斯（Nanette Byrnes）

深度學習－中國網路巨擘的人工智慧

中國最大的網路公司百度正野心勃勃地將人工智慧應用在產品上。

去年萬聖節百度推出Face You應用程式，可將各種鬼怪特效或動物五官加在數位照片上，用的就是深度學習技術，先自動辨識人臉特徵，軟體再以驚人的準確度定位，然後將一張虛擬面具伸縮後覆蓋上去。深度學習不僅讓百度現有的產品更聰明，還激發出公司工程師天馬行空的新創意。

臉書、谷歌、微軟、IBM、百度等公司都試圖將深度學習應用在訓練電腦對話等新領域，同時如紐約大學教授燕樂存（Yann LeCum）所說，將「舊應用從傳統的機器學習過渡到深度學習」。燕樂存亦是臉書人工智慧研究主任，在深度學習的演進上扮演舉足輕重的角色。由於深度學習能有效辨識模式並根據數據做出預測，從機器學習邁向深度學習的進程正逐漸加快。

深度學習是一種特別有效的機器學習，能讓電腦吸收大量數據後替自己編寫程式，也就是先將數據輸入一大型模擬神經元的網路，再讓電腦逐漸學習辨識抽象模式。經過訓練的網路就能辨別圖像中的物體或區分出垃圾郵件。

深度學習技術無疑鞏固了百度作為中國最屹立不搖、最創新本土企業的地位。不論用何種指標，百度都是中國最成功的網路公司，在中國五億3,600萬名網路搜尋使用者中，超過92%使用百度的入口網站和手機應用程式，而且比例還在成長。去年百度甚至切入了音樂串流、保險、銀行等新領域。

百度首席科學家、知名機器學習專家吳恩達表示，在瞬息萬變且競爭激烈的科技業中，百度正應用人工智慧奮力向前。兩年前，百度成立了「深度學習研究院」，專門研發在公司內應用此技術的方法。從那時起，深度學習已協助百度廣告系統轉型，大幅提高營收，開發自動駕駛系統。

吳恩達說，百度成立研究院後做的第一件事，便是打造深度學習平台Paddle，與其他部門的工程師共享，亦經常分派工程師至其他部門學習。深度學習技術現已為百度做出許多貢獻，包括提高防毒過濾器的效能，預測在其龐大的伺服器農場（server farm）內的硬碟可能何時故障等等。

深度學習能提升圖像搜尋的精準度，因而顯著改善了百度的核心搜尋演算法等關鍵產品，亦增進語音辨識引擎的表現，有利於百度開發語音搜尋和新出爐的聲控個人助理「度秘（DuEr）」。相較於在小螢幕上輸入中文字，語音技術讓使用者更優雅的使用行動裝置，對百度在中國的前景格外重要。吳恩達說：「任何一家握有大數據的公司都該慎重考慮深度學習，它是點石成金的超能力。」

作者：奈特（Will Knight）

人機合作－人與機器

雖然人工智慧已見長足進步，但還是與人類合作時表現最佳。

Pinterest的工程師經常開發新的人工智慧演算法，幫助使用者從數不清的食物、產品、房屋等圖片中找到他們想找的東西。換言之，匹配搜尋查詢與相關圖片是留住顧客的關鍵。但直到去年，每測試一個新的演算法是否有效都得花上數天。

為改良機器學習，並更快提供更佳的搜尋結果，Pinterest竟出乎意料地找上「人類智慧」，聘請像CrowdFlower的群眾外包公司，藉眾人之力快速執行「細瑣的任務」，例如標記相片和評量搜尋結果的品質，在一小時內就可測試數百項搜尋詞彙，檢查匹配結果是否夠相關。

Pinterest的經驗揭示出偶爾遭人遺忘的事實，就是人工智慧和機器學習既倚重數學，也仰賴人類智慧。谷歌的搜尋引擎和廣告系統請了數千名「真人評分員」評量人工智慧搜尋結果的品質，並協助辨認詐騙廣告；臉書的臉部辨識軟體讓人們自行標記照片以提升精確性。深度學習儘管是近期語音辨識、語言翻譯、影像分析等重大成就的推手，它亦需要大量的人為訓練。

有許多公司跟Pinterest一樣，聘用CrowdFlower、亞馬遜的土耳其機器人（Mechanical Turk）或其他群眾外包服務，來整理必須輸入人工智慧系統的數據，以教導系統執行某些任務須知的概念和關係。真人的工作則包括分析推特上的語意情緒，以及清除使用者產生的冒犯性照片或影片。

一些人工智慧研究者認為，最有用的模式是一種混合系統，設計之初就是為了讓機器和人類平等合作。例如美國鹽湖城的非營利組織山間醫療（Intermountain Healthcare）正推行一項試辦計畫，讓年輕的糖尿病患者在無法接受照護時自理生活。他們借助位於奧斯汀CognitiveScale公司的雲端運算系統，推出一款能即時提供個人化建議的手機應用程式。它會根據病患的行為和飲食數據，判斷當下對血糖影響最大的因素，然後建議進食時間，甚至提供附近合適餐廳的評論。

雖然許多人工智慧研究者的終極夢想，是製造出能像人類一樣思考的機器，但目前人類判斷和創意仍不可或缺。正如谷歌工程部副總裁詹南德雷亞所說：「就算有一輛高科技的車，還是要由人來決定去哪裡。」

作者：霍夫（Robert D. Hof）

案例研究－Skype即時翻譯

機器學習專家數十年來努力精進語言翻譯，如今微軟用Skype展現成果。

經過30年的嘗試，機器翻譯日常用語仍不到位，或許這其實是人的問題。如果人人講話都像聯合國外交官一樣字正腔圓、語意精確，人工智慧工具就能根據建立好的模式解讀所有話語。然而人越是用隨性的字詞或語意來傳遞思想，翻譯軟體就越難在不靠外力幫助下正確翻譯。

儘管如此，微軟、谷歌、百度、臉書、IBM和許多公司都爭相在這棘手的領域拔得頭籌，畢竟若能提供一流的語音辨識和翻譯，就能有效綁住顧客，以提供透過遠端伺服器和連網來儲存和處理數據的網路搜尋、雲端運算等其他服務。

Synergy Research的數據顯示，去年全球雲端和基礎建設支出高達1,150億美元，年成長率28%。即時翻譯有助於競爭者的雲端服務脫穎而出，否則只會淪為削價競爭的商品。目前多數翻譯服務仍免費，但因全球眾多企業希望有為自己量身打造、功能更佳的翻譯工具，需付費翻譯服務可能即將出現。

微軟在這方面尤其積極，希望協助企業使用者以SkypeTranslator引擎為基礎，打造更好的功能。他們目前專注的任務，是幫顧客事先載入數千筆專門詞彙、參考文件、對話範例、表達方式，以減少因發音導致的翻譯錯誤。微軟研究策略主任鄧迪（Vikram Dendi）說，若能事先輸入大量某些講者可能會用的語言模式資料庫，翻譯軟體就能有更佳的表現。

2011年起，微軟便允許大客戶載入自家的詞彙或書面材料至專門的文字翻譯資料庫，尤其針對內容密度高的技術性文件，以產出比Bing服務更可靠的結果。鄧迪表示，已有超過10萬名用戶選擇客製化服務，需求低的用戶可能一個月只需付40美元，Adobe和推特等需求量較大的用戶，所需費用就高得多。

從1990年代中起，微軟便試過多種策略來破解翻譯，當時比爾蓋茲（Bill Gates）預言語音辨識將在10年內普及。早期必須先將文法和用法的特定規則分門別類，而從2009年開始，微軟將聚焦範圍擴大，將統計和一種以人腦結構和自我教導能力為基礎的機器學習神經網路結合。

微軟研究部主任李彼得（Peter Lee）表示，目前微軟採用五層級神經網來分析語音，最低的數層級分析聲音，是最基本的，如同影像分析軟體會先找出邊緣和表面，而暫不理解物體可能是什麼。然而此方法跟許多先進的人工智慧一樣，到底如何運作，就連參與的研究人員也一知半解。

此外，微軟研究人員亦經常使用「長的短期記憶」，亦即在辨識語音或翻譯時，神經網會做出一系列猜測，並隨著新資訊輸入而不斷修正。偶爾預期模式會突然失效，此時神經網若能重新審視生成先前詞彙猜測的假設，就能更好重新分組。在系統的短期記憶裡維持較長的軌跡，就可能做到此種回溯和之後修正。

要訓練Skype Translator每種語言的神經網，至少需4,000小時的語音樣本和數百萬個詞彙。微軟機器翻譯團隊主任曼尼茲（Arul Menezes）說，他預期某些語言會格外困難，例如阿拉伯語，因為不同人講話的口音差別極大。但若能蒐集足夠不同講者的聲音樣本，就可能讓Skype Translator分辨不同的語調，甚至是不同地區的口音和男女的聲音。

不過日常用語還有其他的變化，比口音更難分辨，例如停頓、模稜兩可的字詞和文化情境攸關的語意，顯示即時翻譯離完美的境界還差得很遠。

「我認為專業翻譯不需要因我們的研究而感到害怕，」曼尼茲露出淺淺的微笑補充道。「他們還可保有工作好長一陣子。」而專業翻譯Rippel對機器翻譯則抱持樂見其成的態度。她說，只要使用者放慢說話速度、講短句，像Skype Translator的自動翻譯服務能有效消弭語言隔閡，對大家都有助益。

下載全文PDF

進一步了解技術