『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊

工業技術研究院

:::

工業技術與資訊月刊

出版日期:

正方形 Icon 觀念探索 Trend

中國網路巨擘百度開始築夢

譯/ 以樂

百度在中國已是當地民眾網路生活中不可或缺的一部分,不過百度的目標是要成為全球強權。

一位全球頂尖的人工智慧研究學者有可能幫助百度和那些位在矽谷的全球最大幾家公司來競爭嗎?


吳恩達(Andrew Ng)是中國搜尋引擎龍頭百度最近聘請的首席科學家。今年6月,他曾在一場科技會議上分享他想進一步發展「深度學習」(deep learning)的計畫。所謂的深度學習是以人腦運作方式為基礎來探究人工智慧的一種強而有力的新方法。深度學習科技已大幅提高電腦在以下方面的效能:語音辨識、語文翻譯,以及圖像辨識。吳恩達過去曾任職谷歌,也在史丹佛大學擔任過電腦科學教授,是多項重大科技創舉背後的推手之一。

百度期待努力轉型成全球強權,於是在今年5月聘請了38歲的吳恩達來率領公司研究團隊,包括一間在美國矽谷新成立的人工智慧研發中心(主攻深度學習),以及兩間在北京的研發中心(鑽研大規模的資料分析)。

常被人喻為「中國谷歌」的百度計畫在未來5年內投入3億美元資金到新成立的矽谷研發中心,及與該中心位在同一層樓的研發辦公室。吳恩達的目標是在2015年底前為該研發中心延攬70位的人工智慧研究人員和電腦系統工程師。

百度期望在2020年前,能將其海外營收的占比提高到總營收的一半。百度和其它的中國網路公司一樣,開始到海外尋找人才和客戶,希望能讓這全球人口最多的國家不再只是世界工廠。

中國的網民人口高達6.32億。在瀏覽人次最多的全球前十大網路公司名單中,中國企業搶下4席,然而在短短1年前,上榜的中國企業僅有一家。在海外掛牌上市的前20大中國網路公司之市值合計約達3,400億美元。社群網路巨頭騰訊的微信行動簡訊服務的海外註冊用戶已達1億人,占其總註冊用戶人數之一半。今年9月,電子商務集團阿里巴巴將在美國紐約證券交易所掛牌上市,可望成為全球有史以來最大的IPO(首次公開發行),其市值估計將達1,500億美元。

當百度和其他中國的公司放眼海外市場時,就發現它們必須和美國網路龍頭公司競爭。谷歌、臉書和亞馬遜等公司在西方市場的地位不太可能會立即受到威脅,但全球其他地區的市場卻是相當龐大並極具開發前景,那些地方有數十億的人口從未上過網。因此,像百度這樣的公司認為自己享有優勢,主要是因為他們已經累積了和網路新手客戶互動的大量經驗。早期投資百度的紀源資本創投公司(GGV Capital)之合夥人符績勛(Jixun Foo)便指出:「中國企業正開始築夢。」

很酷的事

吳恩達表示他在百度的任務是用人工智慧去改變世界,希望能對至少1億的人口產生「重大影響」。吳恩達過去最為人所知的人工智慧成就是在2011年協助神秘的谷歌X研究中心策畫一個叫做「谷歌大腦」(Google Brain)的計畫。該計畫主要是設計來測試深度學習的潛能,目的是透過對模擬的人腦細胞網路輸入資料,來模仿大腦新皮質(主管思想與感知的區域)裡真正神經元的電流活動。此計畫研究的軟體可以學習辨識圖像、聲音和其他感測器資料的模式。在一個很有名的實驗中,研究人員研發了一個有10億個虛擬神經元連結的「大腦」,透過1,000部電腦(每台內建16個處理器)處理了1,000萬個從YouTube影片擷取的圖像後,此軟體已學會如何在沒有人類協助的情況下來辨認貓、人臉,以及其他物品。此結果證明深度學習是一種實際可行的方式,可透過機器學習方式來讓軟體更聰明。

吳恩達稱深度學習為一種「超能力」,他準備在百度建置新一代的深度學習系統。雖然相關服務的研發可能最終仍將停留在腦力激盪階段,但他暗示說可看出未來發展的雛形。他夢想要發明一種可打敗蘋果手機Siri、真正聰明的個人數位助理。展望更遠的未來,該科技可望轉變機器人技術,進而賦予自動駕駛汽車和無人飛機更多功能。他忍不住笑著說:「我們要在這裡做一些很酷的事。」

若百度真想加入競爭行列的話,就必須說到做到,因為谷歌、臉書、微軟和其他公司已開始為自家的研發中心召募了許多深度學習的專家,有時甚至互挖競爭對手的人才。百度得先證明自己有能力在世界的舞台上一較高下。中國企業常被人詬病只會抄襲美國網路領導公司的產品和營運模式——甚至還被譏諷為C2C(copy to China,「複製到中國」)模式。過去幾年來,百度似乎在多到不可勝數的各方面都仿效谷歌,從搜尋首頁的呈現形式到看起來很像谷歌眼鏡的頭戴式電腦——百度眼鏡。百度現在甚至也已開始研發自動駕駛汽車。這次新聘吳恩達,顯然又是再度跟著谷歌的腳步。

吳恩達說,C2C的刻板印象已不再正確,套在百度身上更不恰當。他開玩笑地說:「我過去曾在美國的百度(意指谷歌)工作。」然後他就拿起電話用英文說:「請幫我叫一輛計程車。」不一會兒,百度的翻譯App就用中文說出相同的句子,然後也在螢幕上顯示出同樣的中文字。

進軍全球市場

百度在矽谷的研發中心目前由現年32歲的寇特斯(Adam Coates)帶領。當吳恩達離開史丹佛大學轉職到百度發展時,當時正在從事博士後研究的寇特斯便跟著吳恩達一起到百度工作。吳恩達和寇特斯對他們的新研究中心有一大期許:創造出可以真正自行學習的軟體。

寇特斯說軟體若能聰明到足以瞭解我們生活中的圖像、文字和聲音的話,便能利用這些資訊來幫我們做決定,並且改變我們和科技之間的關係。例如,它或許能分析你度假的照片,然後認出每張照片中的人,辨識出當時他們在做什麼以及地標。日後若你想找舊照片,只要開口詢問即可。或是你可以用手機拍下物品的照片,然後叫軟體去找到類似的圖片。吳恩達的願景是手機可以像人類一樣地辨識語言,你可以用講話的方式來叫它幫你發文字簡訊——即使在很吵的汽車內也沒問題。他希望電子郵件App可學習你和朋友與同事的互動,然後開始替你回答簡單的訊息。

首先,百度的矽谷研發中心會試著讓需要巨大電腦運算能力的深度學習軟體測試變得更容易。新語言辨識模型的訓練時間通常至少需要一週或更久,吳恩達希望能將此時間減半。去年寇特斯所帶領的史丹佛團隊在這方面有重大突破,因此有助實現此目標。他們打造了一個大致類似谷歌大腦系統的神經網路,其成本大約是谷歌大腦系統的五十分之一(僅2萬美元)。他們採用的是Nvidia現有的繪圖晶片。這種方法可讓百度以相對極低的成本來發展功能強大的深度學習基礎架構,同時也很適合百度目前在北京的運作。百度在北京已開始使用較簡單的繪圖晶片叢集,以針對圖像和語言辨識來訓練深度學習系統。

謎樣的公司

走在百度位於北京海淀科技園區的總部,你或許難免會誤以為時空轉移到了美國加州的谷歌總部。免費的咖啡廳?有!室內健身房?有!吊床?有!牛仔褲和短褲、T恤、夾腳拖?有!有!有!唯一把你從錯覺中拉回現實的是刻在大廳天花板上的巨大百度熊掌的企業標誌。這裡所有的一切似乎是在強化C2C(複製到中國)的刻板印象——雖然是吳恩達和其他人努力要除去的印象。百度和美國網路公司一樣,較喜歡扁平化管理方式、小團隊、快速產品循環週期,以及很酷的科技。

深究百度的歷史,你會發現它和矽谷其實很有淵源。執行長李彥宏過去在矽谷的一家搜尋引擎公司——搜信(Infoseek)擔任過工程師,離開搜信後,李彥宏便和當時擔任生物科技公司的業務人員徐勇共同創辦了百度。李彥宏在1997年申請了一項專利,就是根據連結次數的多寡來依序排列搜尋結果名單上的網站,1年之後,谷歌共同創辦人布林(Sergey Brin)和佩奇(Larry Page)才開始申請類似的PageRank(網頁排名)演算法專利。隨著中國網路人口的成長,百度的業務也跟著蒸蒸日上,並在2004年吸引谷歌對它投資500萬美元。根據《彭博商業週刊》(Bloomberg Businessweek)的報導,谷歌曾出價16億美元併購百度,以防止百度上市,但事與願違,百度在2005年8月上市,上市首日股價就狂飆354%。就像谷歌在美國所經歷的一樣,百度之後也迅速地在中國的搜尋引擎市場鞏固了市占率,並善用獲利再將觸角伸往其他不同網路服務的領域。

百度在中國甚至擊退了谷歌,儘管有些觀察家認為中國大陸政府的角色也居功厥偉,畢竟谷歌有許多服務在中國被當地政府禁用。百度成立初期的投資人符績勛指出:「與騰訊和阿里巴巴相比,百度非常重視底層的科技。」但那不代表它的產品全都是獨樹一格的,因為百度提供了許多類似谷歌的服務,包括地圖、瀏覽器和雲端儲存。而聘請吳恩達也似乎是另一種「跟風」之舉。不過百度已在深度學習的研究方面投下重本,也達到或甚至超越谷歌的成就。

例如,百度翻譯App有項功能是可在幾秒內辨認出照片中的物品,然後用英文寫出和說出那物品名稱。百度的行動搜尋App能讀懂手機照片的圖說,然後去找到其他類似的圖片。其功能不僅包括能簡單地找出顏色和形狀都符合的圖片,還能分辨出哪張照片有教會或足球隊在裡面。

該科技讓百度迅速得到很好的投資報酬。在2012年11月,亦即百度在北京開辦深度研究院的4個月之後,百度開始在語音搜尋上使用深度學習技術。語音辨識錯誤率從此減少了25%。另一項類似的改變也有助將光學文字辨識錯誤率降低將近三分之一。負責機器翻譯業務的百度副總裁王海峰表示,這項技術大幅提高了百度翻譯App在解讀像是餐廳菜單方面的能力。
百度深度研究院常務副院長俞凱的神經網路甚至提高了百度的獲利。那系統會先分析廣告有哪些特點會特別吸引人,會讓人更常去點選,然後就去挑選符合那些條件的廣告,在最恰當的時機去播廣告。這項技術讓百度可拉高收費。李彥宏在4月份告訴投資人說,百度第一季的獲利和營收也因受惠於此項科技而攀高。

然而百度和谷歌一樣,儘管不斷地成長,依舊會面臨來自小型新興企業和競爭對手的挑戰。百度最擔心的是去年它在搜尋市場的領導地位開始下滑。根據彭博情報(Bloomberg Intelligence),百度在中國桌上型電腦搜尋市場的市占率已從過去的80%下滑至75%。而行動軟體公司奇虎360在2012年成立的新公司So.com目前在桌上型電腦搜尋市場的市占率已從1年前的10%成長至16%。

民眾過去都是使用電腦上網,但現在的趨勢卻已迅速從電腦轉變成行動裝置,這變化在中國尤其明顯,很多人第一次上網都不是從個人電腦、而是從智慧型手機開始的。中國大陸目前的行動上網族群占總上網人口的83%,但百度曾一度因應不及。於是百度便在去年迅速調整策略,開始付錢給行動業者來部署其行動App,並以19億美元收購中國的App配銷商「91無線」,也同時針對手機上網趨勢來重新設計服務與形式。上述策略讓百度行動搜尋App的每日平均使用人次從6個月前(即第三季)的1.3億美元成長至第一季的1.6億美元。不過百度必須經常因應原生行動公司與App的產品來隨時調整策略,以保持領先地位。

消費者從以傳統電腦上網到以智慧型手機和其他行動裝置上網的轉變得太快,造成感測資料(sensory data)的暴增。感測資料是類似圖像、影音與語音這類會難倒傳統軟體的資料。不過吳恩達指出,深度學習可以讀取這些數據。他讓他的新雇主百度看到了一個可望大幅超越行動競爭對手的機會,就是推出能了解這世界的服務。
這科技或許也能幫助百度贏得全球其他市場消費者的芳心。雖然已開發國家的民眾慣用電腦已達20年之久,但這世界上還有其他總計50億的民眾過去不曾上過網,也不習慣電腦科技。
他們最先(或唯一)會用來上網的工具是行動裝置,而深度學習將可提供直覺性的介面來吸引這些初次接觸電腦運算產品的民眾。吳恩達表示,新接觸網路的民眾其實和我們所有人一樣,都不想學習新的互動模式。他們會傾向用自然說話的方式來使用裝置,以取得想要的資訊或翻譯。

這類科技或許也可幫助百度針對不同的語言與地區來量身打造搜尋結果與App。百度2008年曾短暫地進軍日本市場,但因其搜尋引擎無法符合當地所需,最後鎩羽而歸。現在,百度選擇鎖定的是幾個開發程度較低的市場,包括東南亞、中東、北非與拉丁美洲。今年7月中旬,百度在巴西推出搜尋引擎服務。

對百度來說,讓公司變得更國際化也是相當重要的。許多海外人士,特別是西方人士,鮮少或從未聽過百度這家公司。對外國人來說,百度還是一家很神秘的公司。有些來自谷歌、微軟、臉書和頂尖大學的人工智慧專家與研究學者表示他們幾年前從未聽過百度,直到吳恩達加入後才開始注意到這家公司。

百度另一個問題是外國人比較不會注意到這家公司。百度似乎只著眼於中國文化,再加上中國科技產業向來給人缺乏原創性的印象,使得百度和谷歌及其他美國科技領導公司競爭的能力因此受限。百度競爭對手廣聘來自世界各地的員工,但百度卻似乎傾向只聘用中國員工。

文化轉變

在矽谷研發中心,吳恩達正試著扮演好雙重角色——文化促進者和技術遠見者。他最近最喜歡的一本書是萊斯(Eric Ries)所著的《精實創業》(The Lean Startup),這是一本企業家的管理手冊。他同時也去向企業家兼創業家大師卡普藍(Jerry Kaplan)請益有關聘請工程師、鼓勵他們達成使命,以及企業文化等問題。

由於從小生長於國際化環境的吳恩達是幫百度吸納海外人才的重要關鍵。吳恩達說他期許百度的研發中心能和其他研究人員與軟體開發族群分享想法,並與其他的美國競爭對手一樣融入矽谷社群。

假使吳恩達的計畫成功,百度將有機會向世人證明中國的網路公司所能做的不只是跟在美國公司後面。具有感知能力的電腦(perceptive computers)未來可望在許多方面代替人類做許多事,或許可以讓人類更有餘力去思考更有創意的活動。吳恩達指出:「就好像是工業革命讓人類免於許多需要耗費體力的單調繁瑣工作,我想人工智慧也有機會讓人類免於許多耗腦力的單調繁瑣工作。」。若百度想擊退谷歌的話,就必須去開闢自己的道路。

本文作者特約編輯羅勃 '霍夫曾在5月╱6月撰寫過有關神經型態電腦運算的文章。
克莉斯汀娜 '拉森(Christina Larson)於北京撰寫本文部分內容。
Copyright©2014,Robert D.Hof. All Rights
Reserved.

下載全文PDF Icon下載全文PDF