『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊

工業技術研究院

:::

工業技術與資訊月刊

出版日期:

正方形 Icon 觀念探索 Trend

50大聰明公司(下)

譯/施祖琪

39. 國際商業機器公司 IBM

雖然 IBM 把 Watson 機器學習系統炒過了頭,
但這家公司仍然最有可能取得改善治療結果所需的醫療資料。


撰文/弗里德曼(David H. Freedman)



本刊取得美國麻省理工學院Technology Review期刊圖文授權
本刊取得美國麻省理工學院Technology Review期刊圖文授權

在醫院,Paul Tang陪著剛做完人工膝關節置換手術的妻子,美國每年約有70萬人接受這種手術,當太太的主治醫師進來查房時,他詢問主治醫師,根據以往的經驗,她還要等多久才能恢復正常作息,但主治大夫始終不給明確的回答。「到最後,我終於懂了,」Tang說:「那位醫師也不知道。」Tang不久後便發現,大多數醫師其實並不清楚病患出院後回家和重新開始工作後的狀況,但那對病患而言卻是最重要的事。

Tang是名基層醫療醫師,他現在還是會看診,但同時也是 IBM Watson Health部門的醫療轉型長,Watson是 IBM 極其看重的機器學習系統,Watson Health則是專責開發Watson醫療健康應用的事業體,Tang 指出,Watson可以提供醫師目前無法取得的資訊,譬如,它可以告訴醫師,像Tang太太一樣的病患需要過多久才能正常走動或爬樓梯,Watson甚至還能幫忙醫師分析醫學影像及組織樣本,以針對每一位患者的情況量身規畫最佳的療程。

正因為這類應用的前景大好,醫療產業近來成為機器學習技術最火熱的目標領域,市場研究公司CB Insights便指出,2013年以來,全球至少有106家新創企業搶進該領域且至今依然營運。

不過,那些新創公司卻沒有一家享有 Watson的光環,這都得歸功於 Watson 於2011年在美國老牌益智問答節目「危險境地」(Jeopardy!)中掄元,以及IBM其後一波接一波行銷宣傳的成果。但是,Watson最近卻負面新聞頻傳,稍早,IBM曾大張旗鼓宣傳與美國休士頓的安德森癌症研究中心(M.D. Anderson Cancer Center)結盟,但該合作案已於今年劃下休止符。隨著IBM的營收下滑、股價震盪,分析師紛紛質疑Watson究竟能創造多少價值。知名技術投資人、同時也是創投公司 Social Capital創辦人的帕里哈皮蒂亞(Chamath Palihapitiya)今年5月便在CNBC節目上說:「Watson是個笑話。」

然而,這些種種針對Watson 的批評,以及安德森癌症研究中心對Watson的評價,似乎並非起因於Watson有任何技術上的缺陷,而是因為IBM對Watson的技術進展過度樂觀的預測所引發的反彈。事實上,目前看來,Watson Health仍穩坐人工智慧(AI)於醫療領域的龍頭地位。假使 Watson 至今在這些方面的成果還不夠亮眼,最主要的原因是,它需要某些類型的資料來進行「訓練」,但在大部分的情況下,此類數據不是供應有限、就是難以取得,這問題不只困擾Watson而已,也困擾著每一家想搶攻醫療商機的機器學習廠商。

雖然醫療資料匱乏和無法取得的現實可能拖慢Watson的腳步,但此問題對IBM競爭對手的傷害應該更大,機器學習系統的廠商若要取得數據,最有效的辦法就是與大型醫療機構緊密合作,但是此類機構往往在科技應用方面特別保守,IBM有一點比新創公司、甚至比蘋果公司(Apple)和谷歌(Google)都做得更好的,就是贏得大型組織的高階主管和IT經理人的信賴。雖然安德森癌症研究中心的案子出了點問題,但 IBM 手中依然握有關鍵優勢─它已成功把Watson推入許多醫療中心、醫療衛生管理團隊和生命科學公司內,這些夥伴都能為Watson提供關鍵的數據,助其重塑醫療服務的未來。

不切實際的時間表

IBM與安德森中心的合作破局,應該是IBM對Watson過度宣傳,「呷緊弄破碗」的結果。

安德森癌症研究中心與IBM在2012年結盟,Watson被賦予的目標是要讀取病患的症狀、基因序列和病理報告,搭配醫師的筆記和相關學術論文,協助醫師進行疾病診斷與治療,只不過,雙方都對此科技期待過高。

2013年時,當IBM宣告「全新的運算時代已經崛起」時,它給《富比士》雜誌(Forbes)留下了Watson「已進入臨床實驗階段」,且再過幾個月便能實際用於治療病患的印象。2015年,《華盛頓郵報》(Washington Post)還曾引述一位IBM Watson 經理形容Watson正忙著建立「機器和人類之間的集體智慧模型」,當時《華盛頓郵報》還說那套電腦系統正「跟著醫師受訓,要做醫師辦不到的事」。
今年2月,經營安德森癌症研究中心的美國德州大學對外宣布已結束Watson計畫,為了這項計畫,安德森中心已支付給IBM 高達3,900萬美元的費用,遠高於雙方原本簽訂的金額240萬美元。而且四年來,該計畫一直停留在測試階段,尚未產出一套可直接用於病患身上的工具,儘管安德森中心拒絕評論Waston,但看來問題的根源主要來自中心內部對計畫管理方式和經費規劃的歧見。

不過,這不代表IBM自己沒在Watson上踢到鐵板,其實,問題的嚴重性可能比目前各個計畫呈現出來的還大。

想要知道是什麼原因造成計畫延宕,就得先了解像Watson這樣的機器學習系統是如何訓練的,Watson 透過持續不斷調整內部的處理程序來「學習」,以針對不同的問題產出正確機率最高的解答,例如:哪些放射影像最有可能照出癌細胞?而且正確的答案還必須是已知的答案,這樣才能教導 Watson 哪些時候它得出的答案是對的、哪些時候的答案又是錯的,Watson 吸收的問題越多,正確率就會越高。
如果只是訓練系統用X光片判讀病患體內有無惡性腫瘤,這還相對簡單。但倘若是超過人類現有知識範圍的突破性問題,如,判定基因變異與特定疾病之間的關係,Watson就會陷入雞生蛋或蛋生雞的窘境─連專家都還無法妥善歸納的資料,又怎麼能拿去訓練Watson呢?

「如果你想訓練無人自駕車上路,那麼,任何人都可在路樹或路標上做標記,來教系統學會怎麼辨識它們。」美國紐約史隆凱特林癌症中心(Memorial Sloan-Kettering)的電腦病理學家福斯(Thomas Fuchs)指出:「但在醫學的專科領域中,你非得是受過幾十年訓練、經驗老到的專家,才有本事正確標記出要『餵』給電腦的資訊。」

類似的難題也出現在IBM期盼Watson能有所貢獻的各個領域上,困擾著其他每一家機器學習方案的業者,想要讓 Watson 吸收大量的資料,並特別針對某位病患擷取出有意義的資訊,就必須要先有人親自動手、用好幾千個案例先走過一遍;若要診斷出致病基因,Watson首先得取得數千筆的病歷資料和DNA分析的報告。但是,病患的基因與醫療紀錄卻不易結合與對照,而且,在大部分的情況下,醫療機構的資料格式不但相當紛雜多樣,資料還常常散置於數十個不同的系統中,根本難以使用。

基層醫療執業醫師、同時也是IBM Watson Health 的醫療長嘉殷(Anil Jain)表示:「大約有三分之一的醫療支出是非必要的。」因此,很多人寄望機器學習能幫忙減少醫療浪費的問題。

可是,想要讓醫師做出更好的診療決策,Watson就得在病患的病歷及Tang所謂「身體健康的社會決定因子」之間找出關聯性,這些因子包括病患有無吸毒、飲食習慣好不好、呼吸的空氣乾不乾淨等等。但Tang也承認,目前幾乎沒有一家醫院或醫療機構有辦法取得大部分病患的資料,造成此問題的一大原因是,許多醫院遲遲未引入現代化、資料導向的運作模式,「醫療產業採用新科技的速度慢得令人尷尬,」美國克里夫蘭醫學中心(Cleveland Clinic)醫師暨醫療資訊專家柯里(Manish Kohli)表示。

碰到手中握有醫療資料的單位,IBM的常見做法是直接買下來收歸己有,目前為止,該公司已經收購了Truven Health Analytics、Explorys和Phytel 等擁有大量醫院和病患資料的企業,即使與安德森癌症研究中心的合作案告終,IBM仍然擁有不少舉足輕重的合作夥伴,能取得更多的病患資料。

其中之一是Atrius Health,該組織是服務美國波士頓區近900位基層醫療醫師的大型醫療網路,Atrius與IBM合作,希望開發並測試一套使用Watson技術的系統,以便從大量龐雜的醫師筆記、病歷和醫學論文中提取出治療特定病患的寶貴訊息。Atrius的醫療長奇慕拉(Joe Kimura)說:「對於基層醫療醫師來說,查找資料的工作非常枯燥繁重。」他還直言道,電子病歷出現後,問題不減反增,因為電子病歷系統造成病患每次就診產生更多的資料,卻沒有提供可讓醫師快速檢索資料的標準格式。

病患的病歷裡有很多重要的紀錄,其中最關鍵的資訊多半是傳統資訊系統無法理解的句子,但Watson 不是傳統的資訊系統,它能透過當初為了出戰「危險境地」而開發出的自然語言處理技術,解讀出字句的意義。在理想的情況下,Watson 可為醫師提供診療方案的建議,進而避免病患受到過度治療。

「為什麼我們只想著為跌碎髖骨的病人提供最好的治療?」奇慕拉醫師說:「為什麼不預測哪些人比較容易跌倒,在他們受傷前就避免摔跤呢?醫療照護的服務應該要往源頭挪移才對。」

此外,Watson Health 也與紐約中央醫療中心(Central New York Care Collaborative;CNYCC)攜手合作,CNYCC是政府出資成立的機構,服務紐約州六個郡內共2,000多家醫療供應商,CNYCC希望藉由與Watson Health合作,減少急診病患和出院後再入院的病患人數,雙方的合作也可能為Watson帶入大量的病患資料。

不過,取得醫療資料的方法不只這一種,Google的一家姐妹公司便打算直接跟病患要資料,這家公司是同屬Alphabet 旗下的醫療事業Verily Life Sciences,目前正與杜克大學和史丹佛大學聯手建立一套包含一萬名志願者病歷的高度結構化資料庫,完工後,該資料庫不僅將涵蓋志願病患的臨床就診資料,還會包含來自穿戴式健康追蹤設備的資料,雖然可能還需要至少10年的時間,才能從資料庫產出實際可用的結果,但這依然是擴大醫療資料來源的一大突破。

在史隆凱特林癌症中心裡,電腦病理學家福斯正率領團隊,訓練一套AI系統來判讀組織染色的投影片,負責訓練的研究人員必須建立一個龐大的數位投影片庫,且投影片上還須帶有確診病例和其他關鍵資料的註解,因此,該團隊正馬不停蹄地以每月四萬張投影片的速度來建資料庫,福斯說:「這個計畫的工作量遠大於其他計畫,因為生物領域的變異量實在太多了。」

雖然說安德森癌症研究中心的Watson合作計畫未能起飛,但與該計畫同時啟動的另一大型計畫仍在繼續進行中,該計畫的目標是要收集每一位就診病患的臨床資料,相關的資料種類多達1,700種。負責該計畫的科學家福特瑞(Andy Futreal)表示,對於培養Watson這類系統的能力來說,病患資訊與研究資料的結合非常重要,他說:「資料有了,你才能展開AI 機器學習的工作,進而判斷到底誰適合、誰不適合各種療程。」

至於IBM,則繼續透過合作夥伴來取得醫療資料,單就癌症的診斷和治療而言,該公司的合作夥伴便已囊括史隆凱特林癌症中心、梅約診所(Mayo Clinic)、哈佛大學─麻省理工學院的博德研究機構(Broad Institute),以及醫療診斷龍頭企業奎斯特(Quest Diagnostics)等知名組織。IBM與史隆凱特林癌症中心的結盟已經催生出一套系統,可篩選醫學期刊文獻的內容,為醫師提供治療方案的建議,該醫療決策系統更已獲得一些醫療機構採用,包括:美國佛羅里達州的木星醫療中心(Jupiter Medical Center)及印度的一家連鎖醫院。

在新藥開發上,Watson Health也與美國貝洛神經醫學中心(Barrow Neurological Institute)合作,找出肌萎縮脊椎側索硬化症(ALS)的五種致病基因,而在此前,過去從未有人發現這些基因與ALS之間的關聯,此外,Watson 還幫加拿大安大略腦科學研究所(Ontario Brain Institute)篩選出21種有潛力的候選藥物。

Watson 真的可以帶動醫療產業變革,並確實提升醫療成果及降低成本嗎?創投公司Bessemer Venture Partners的合夥人克勞斯(Stephen Kraus)認為不無可能。克勞斯長期關注醫療產業,並投資過一些與醫療相關的AI新創企業。他說:「Watson是玩真的,它不是為了哄抬股價而投出的煙霧彈。」不過,克勞斯和其他專家一樣,也對Watson的時間規劃抱持保留態度,「畢竟這件事的難度很高。這技術不會今天就成真,就算再過五年也不見得能實現,而且無論如何也不可能取代醫師,」他補充道。


40. 奇異公司 General Electric

為了化身高科技企業,這家125年的老店內部正大舉應用人工智慧,第一步便是從自家的科學家開始。


撰文:沃伊克(Elizabeth Woyke)

2011年,尼克斯(Jason Nichols)甫於美國加州大學柏克萊分校完成有機化學的博士後研究計畫,就加入奇異公司國際研究院(GE Global Research),本以為就此將投入化學研究的志業,但經過四年開發工業廢水處理的新材料和系統後,他便轉調到公司的機器學習實驗室,今年還開始研究擴增實境(Augmented Reality)的技術。如今的他算是半個化學家、半個資料科學家,對於一家致力將AI注入機器與工業生產流程的企業來說,像他一樣的複合型員工正是最不可或缺的人才。

15年前, GE的作業員與技術人員只能靠聽機器運轉的聲音和檢查儀表板,來監測飛機引擎、火車機頭及燃氣渦輪機,現在,他們改用AI做同樣的事,甚至還能提前預測機件何時會故障。GE希望能拓展其技術的應用範圍,在2020年之前躋身全球最大軟體供應商之林。為了達成這個目標,該公司已在2011年加大投資力度,豪擲10億美元來收集並分析來自機器的感測器數據,下一步的策略則是要運用AI 打造更智慧的模型,藉此創造更多的優勢來抵禦市場強敵,包括長期勁敵西門子,以及把觸角延伸到工業分析領域的軟體龍頭企業,如IBM。

當然,把AI 融入一家成立於1892年的老牌企業之中,絕非易事。首要之務是培訓公司內部的技術人才,而GE在世界各地的員工多達30萬人,尼克斯任職的國際研究院便正在規劃線上訓練課程,教授機器學習和舉辦座談會,讓科學家有機會探索新的角色。目前為止,近400名員工已通過GE的資料分析認證,還有約50位科學家投入了尼克斯所從事的數位資料分析工作。

雙重身分

在這些雙重身分的科學家中,很多人都參與了雲端代管軟體模型的開發計畫,讓GE的機器運作起來更省錢、更安全,GE運用它從機器感測器收集來的資訊,佐以物理式模型、人工智慧、資料分析軟體,以及科學家和工程師的專家知識,打造出機器的「數位雙胞胎」(Digital Twins)。雖然數位雙胞胎主要是軟體程式碼,但最精密的版本看來就像3D電腦輔助設計圖,滿布著互動圖表、圖示和示意資料,因為有數位雙胞胎,GE才能使用確切的感測器資料來追蹤飛機引擎、火車機頭、燃氣渦輪機和風力發電機的器件磨損狀況,進而更精準預測和規劃維修時間,而不是靠假設或估算的方法,舉例來說,飛經美國的班機可把其數位雙胞胎設於GE位在加州的伺服器上,藉此規劃出最佳的零件維修時間表。

除了預測機器的使用壽命,該公司的虛擬模型還能進一步優化產品的運作狀況。GE表示,數位雙胞胎能讓風力發電廠多產生將近20%的電,並把其中一個火車機頭一年的燃料量和排碳量分別減少3.2萬加侖和17.4萬噸。目前為止,這些軟體模型的出貨量已逾70萬,到今年年底可能會超過100萬。

這套技術運用人工智慧不斷自我更新,萬一碰到資料毀損或遺失的狀況,GE還能借機器學習之力來填補空白,奇異公司國際研究院的軟體研究副總裁派瑞斯(Colin Parris)指出,機器學習也是人工智慧的一種,可以不靠編寫程式就使電腦學習。他還說,GE將電腦視覺與深度學習(Deep Learning)和增強式學習(Reinforcement Learning)技術結合起來,使攝影機能在髒兮兮、布滿灰塵的金屬渦輪葉片上找到細微的裂痕,深度學習和增強式學習同屬人工智慧技術,前者特別善於模式的辨識,後者則可達成機器運作的最佳化。

只要一個比火柴盒車稍微大一點的小型機器人,便足以檢視運作中的引擎狀態,它搭載電腦視覺與多種不同AI技術,若架設在緩慢轉動的渦輪葉片上,即可找尋飛機引擎內部的裂縫。

類似的技術也能應用於無人機,可在天然氣田和油田上空60公尺處,觀察廢氣燃燒塔上的腐蝕情形。

不是一時狂熱

為了開發和使用這些系統,GE的研究人員必須精通機器的物理原理及AI演算法。
「在這個地方,分子生物學家會跟機器學習專家並肩而坐,控制理論人才也會跟材料科學家坐在一起討論,」奇異公司國際研究院的分析技術總監葛拉伯(Mark Grabb)表示:「這種團隊合作的力量非常強大,但沒有什麼能強過把同樣知識放在同一人的大腦裡,因為那效率極高。」

尼爾森(Matt Nielsen)的大腦就是個好例子。尼爾森是物理學博士,他在1998年加入奇異國際研究院後,開發了光子學,也負責電動車軟體的研究工作,2015年時,他全面投入公司的數位化研究領域,他現在是數位雙胞胎開發者團隊的領導人,負責建立基於物理的模型,以搭配機器學習演算法運作。

另一個雙重身分科學家的例子,珍克(Sahika Genc)本來是加護病房警報系統的開發人員,但2014年時已調至GE的機器學習實驗室服務,現在的她是一名機器學習科學家,運用深度學習和增強式學習技術來加強GE能源管理系統的效率,在最近一項的專案裡,她便使用機器學習和傳熱理論,研究能量消散和儲存的模式。透過她所做的預測,GE將可協助客戶減少能源消耗。

這些複合型研究人員極可能是GE在下一世紀維持競爭力的續命符,幫該公司在渦輪機、噴射引擎與火車機頭等競爭激烈的成熟產業中,找尋業績成長的機會。

不過,軟體研究主管派瑞斯坦言,在GE的2,000名研究人員之中,仍有人認為公司部分的新做法只是「一股腦的跟風」。

但是,無法跨足新領域的科學家可能會被甩在後頭,2016年GE才剛新增100個與人工智慧和機器人技術相關的研究職位,今年1月,隨之又裁撤了非屬「數位工業」策略核心領域的研究團隊。

下載全文PDF Icon下載全文PDF