『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊

工業技術研究院

:::

工業技術與資訊月刊

出版日期:

正方形 Icon 創新之鑰 Innovation

臺灣巨量資料 發展的挑戰與契機

撰文/余孝先 圖片來源/美聯社

巨量資料分析技術是近年來快速竄升的領域,對企業來說,可以發現諸多非經驗、直覺、或理論所能發現的事實,使得企業的決策品質大幅提升;對政府來說,則可以增加行政效率及精簡成本。目前導入巨量資料分析的臺灣企業仍屬少數,且普遍缺乏資料應用專業,不僅蒐集、應用資料能力薄弱,且無法整合、分析內部與外部資料,未來亟需建立自主的巨量資料應用能力。

巨量資料分析技術,可以發現諸多非經驗、直覺、或理論所能發現的事實,使得企業的決策品質大幅提升,並取代大量人力,完成許多人力無法完成的工作。
巨量資料分析技術,可以發現諸多非經驗、直覺、或理論所能發現的事實,使得企業的決策品質大幅提升,並取代大量人力,完成許多人力無法完成的工作。

隨著巨量資料技術推陳出新,其應用層面愈來愈廣,有些國家已嘗試運用巨量資料分析,以改善施政品質。例如,日本政府已與電信業者合作,分析觀光客的手機資料,蒐羅出發地、交通工具、停留時間、飯店類型,藉此開發新的觀光景點、路線等相關資料,並進行深度分析,以期振興觀光產業。

韓國政府則與電信業者Korea Telecom合作,分析民眾位置、公車站位置等資訊,規劃夜間公車最佳行駛路線。美國北卡羅萊納州衛生與公眾服務部(Department of Health and Human Services)則運用巨量資料分析,有效地降低醫療補助遭濫用、詐欺,撙節政府醫療支出。

根據工研院產業經濟與趨勢研究中心IEK資料,全球巨量資訊分析需求呈現快速成長,預測2020年將達到151億美元,未來巨量資料運用將成為發展產業與提升競爭力的重要工具之一。根據Wikibon的預測,到了2017年,全球巨量資料市場規模的前三大分別是專業服務、分析應用、以及運算平臺;而從2013年到2017年,年均複合增長率 (Compound Annual Growth Rate; CAGR)最高的前三名,依次為分析應用、NoSQL,以及專業服務,其成長率分別為46.34%、42.63%,以及29.32%。面對巨量資料浪潮來襲,臺灣的機會應在於發展「應用與服務」,建構臺灣自主巨量資料處理平臺,支援領域應用驗證,並催化巨量資料創新應用。

日本政府已嘗試運用巨量資料,對於觀光景點深度分析,拓展觀光產業。
日本政府已嘗試運用巨量資料,對於觀光景點深度分析,拓展觀光產業。

巨量資料分析能力是一種競爭力

經由導入巨量資料分析技術,有些時候可以發現諸多非經驗、直覺、或理論所能發現的事實,使得企業的決策品質大幅提升;也有些時候巨量資料技術自動分析出來的技術雖然與人工分析的結果差不多,但是用自動分析可以取代大量人力,完成諸多以人力所無法企及的工作。

由於巨量資料分析是個實用的技術,在先進國家已有愈來愈多企業導入巨量資料分析技術來提升競爭力。然而,巨量資料分析並非機器或設備,無法依使用手冊組裝、啟動、調校就可以開始運作發揮效能。在導入巨量資料分析技術前,企業應先進行數項評估。首先,應先找到合適的應用標的;其次,要看看是否有無足夠的資料可供分析,倘若足夠,仍得檢視待分析的資料,是否以數位型式儲存,方能決定可否進行巨量資料分析。

除此之外,企業更得慎重評估,進行巨量資料分析,是否真有價值,是否真有助於進行企業決策,不必為追趕潮流,貿然耗費人力、財力;若決定進行巨量資料分析,還得評估企業內建置巨量資料系統的人才是否齊備。最後,企業更得考量,進行巨量資料分析,是否在法規的容許範圍之內,例如個資法。若有其他困難、障礙,就得先研擬相應的對策。

中文語意分析難度高

巨量資料分析的核心技術在於機器學習等演算法,在華人世界裡,巨量資料分析還得克服另一重大挑戰,即中文語意分析難度甚高。例如,在運動賽事中,倘若中華隊以懸殊比數擊敗日本,有些媒體的新聞標題可能是「中華隊大勝日本隊」,有些卻是「中華隊大敗日本隊」;勝、敗兩字意義完全相反,但整個句子的意義是相同的;大多數讀者皆知曉其同義,但要讓電腦有能力自動理解是十分困難的。

再舉一些例子,有時候即使是同一句話,也可能因為前後文字不同,字義有所歧異,甚至截然相反;例如,「我30分鐘後到,你如果早到了,你就等著吧」與「我30分鐘後到,你如果晚到了,你就等著吧」,同樣是「你就等著吧」,前者溫馨,後者肅殺。另一個例子是「在夏天,能穿多少,就穿多少」與「在冬天,能穿多少,就穿多少」;又如「以前喜歡一個人,所以想結婚」、「現在喜歡一個人,所以不想結婚」。讀者應可看出其間之不同,但電腦能嗎?

人才匱乏是最大關卡

由於巨量資料是2015年最夯的技術,突然爆發了大量的人才需求,但是具有相關專長訓練的人才有限,所以人才不足已是推動巨量資料的最大關卡。巨量資料應用開發團隊需有三種人才,缺一不可;包括為數學與統計人才、資訊科技人才、與產業應用人才。例如,某一巨量資料團隊專攻電子商務資料分析,就得延攬了解電子商務產業實務的人才。

數學、統計,與資訊科技人才,除非自己下苦工自修,否則大多得出身相關科系,才能夠勝任;但產業應用人才類似電子產業的產品經理,負責內外溝通、聯繫、協調與整合,任何科系畢業生都有希望獲得錄用,包括非理工科系的畢業生。也就是說,卡位巨量資料經濟商機,人人都有機會。

若論人才數,在巨量資料技術團隊中,資訊科技人才數居首,數學、統計人才數次之;產業應用人才數雖最少,卻扮演關鍵角色。再以電子商務為例,若有廠商延請巨量資料技術團隊進行資料分析,卻無產業應用實務人才參與,則資訊科技人才與數學、統計人才連資料重要性高低都難以分辨,遑論達成任務。雖說產業應用人才不必一定要具備數學、統計與資訊科技知識,但若能補強相關知識,更能與巨量資料團隊其他成員溝通無礙,也更適合擔任領導者。同樣的,數學、統計人才若自我進修資訊科技與產業應用入門知識;資訊科技人才若自我進修數學、統計與產業應用入門知識,亦較有可能晉升為團隊主管。

巨量資料分析需要各式資料科技及產業應用人才,彼此相輔相成,使技術得以更有效發揮。
巨量資料分析需要各式資料科技及產業應用人才,彼此相輔相成,使技術得以更有效發揮。

中小企業的普遍困境

與巨量資料分析相關的產業很多,包括物聯網、伺服器、手持終端、雲端服務、軟體元件、工具軟體、特定演算晶片、與解決方案顧問服務等,未來發展機會都很大。

相較於美國,目前導入巨量資料分析的臺灣企業仍屬少數。巨量資料分析雖是未來產業核心競爭力,但臺灣企業普遍缺乏資料應用專業,不僅蒐集、應用資料能力薄弱,且不具備整合、分析內部與外部資料的能力。若要尋求國際大廠所提供的巨量資料分析服務,則因索價高昂,占臺灣98%的中小型企業根本無力負擔,導致國際競爭力日漸喪失。所以在需求面上,臺灣亟需建立自主的巨量資料應用能力。

在供給面上,臺灣資訊軟體、資訊顧問業的巨量資料分析與運算平臺,尚處於萌芽階段,專業服務與分析應用產業體質仍頗為薄弱,並以專案建置、系統整合為主要業務,罕有產品、系統可進軍國際市場;由於缺乏巨量資料分析自主品牌軟體與本土人才,目前仍高度倚賴從國外引進軟體,進行加值利用,這點是我們想要改變的地方。
工研院推動巨量資料分析,設定了二大目標,即產業智慧化與巨資產業化。產業智慧化就是運用成熟實用的巨量資料技術來提升各行各業的智慧化程度;而巨資產業化,則是隨著產業智慧化需求的增加,逐步扶植起臺灣自主的巨資技術供應鏈。

台灣的機會:應用與服務。
台灣的機會:應用與服務。

由指標廠商扮領頭羊

關於產業智慧化,在製造業方面,工研院首先選定半導體產業導入巨量資料,並已逐步擴及機械等產業。在服務業方面,則已在電子商務業有了實際的應用,效果十分顯著,現在正逐步擴及其他服務業。我們希望藉由一些成功的案例,一方面吸引更多的人投入,另一方面藉此建構臺灣自主巨量資料平臺,並鼓勵新創巨資顧問服務業,以支援各領域的巨量資料分析實際應用。

巨資顧問服務企業與智慧化顧問服務公司若要成功,關鍵當是從產業需求刺激巨量資料相關產品、服務上市,並證實其可強化企業核心競爭力;國內指標廠商應扮演領頭羊,率先建立巨量資料分析的成功應用典範,以鼓舞其他廠商勇於投入。同時,政府也應積極協助產業,建立支援多樣化應用的國產平臺,以期擴散應用於中、小企業,並進一步整合政府、企業的開放資料,以發展更多元的創新加值應用服務;若能如此,則臺灣產業智慧化、巨量資料產業化目標的達成將指日可待。(本文作者為工研院巨量資訊科技中心主任)

下載全文PDF Icon下載全文PDF