『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊

工業技術研究院

:::

工業技術與資訊月刊

出版日期:

正方形 Icon 科技快訊 Locomotive of ITRI

中文自然語意理解技術 智慧問答超Smart

高永謀

在蘋果推出Siri語音助理之後,全球各科技大廠、研究單位紛紛研發人機介面相關軟體,工研院也推出國內第一套具對話能力之自然語意理解技術;此技術創新應用到電影領域,開發出可理解語意、敘述性問句、可糾正問句的中文電影查詢口語問答系統,未來將可整合至智慧電視、智慧車輛等載具,是智慧生活的明日之星。

20世紀80年代的美國影集《霹靂遊俠》(Knight Rider),是諸多台灣「五年級生」、「六年級生」美好的童年回憶;即使遺忘了所有劇情,對於號稱刀槍不入、無所不能的霹靂車「夥計」,及其男主角李麥克之間幽默的對話,依然津津樂道。

《霹靂遊俠》首映於1982年,歷經31年後,當下雖無科技大廠打造出「夥計」,但可與使用者進行對話的人工智慧軟體,已略見雛形。在蘋果推出Siri後,全球科技大廠、研究機構紛紛跟進研發人機介面相關軟體,而工研院所研發的中文自然語意理解技術,是國內自主開發的第一套具對話能力的口語問答系統,突破現行以短句語音辨識為主的技術能力,具指標性意義。

Siri促使人機介面相關技術躍進

工研院也將此系統創新應用到電影領域,結合「開眼電影網」網站資料,開發出全球第一套可理解語意、敘述性問句、可糾正問句的「中文電影查詢口語問答系統」。

這套電影查詢口語問答系統,為運用雲端伺服器與智慧型手機應用程式所建構的服務性系統,使用者只要對著智慧型手機,以最自然的方式提問,即使提問中有錯誤,電影查詢口語問答系統依然可運作。

「若語音助理理解能力有限,使用者大多會視其為娛樂應用程式,工研院的中文電影查詢口語問答系統,因為可以理解複雜語句,加上可以糾正問句及連續式問答,應用範圍更有可看性。」工研院巨量資訊科技中心組長馮文生表示,人機介面相關技術發展20餘年,但在Siri問世前未受到廣泛注目,技術成長頗為緩慢。

在蘋果的Siri引發風潮後,微軟、IBM、Google等大廠也不甘落後,投入可觀的人力、資源進行研發,終於使得人機介面相關技術大幅躍進。馮文生指出,國際研發人機介面相關技術的團隊,動輒超過100人,若將支援單位列入計算,更超過500人,工研院研發團隊僅有20多人,卻能成功打造中文電影查詢口語問答系統,相當難能可貴。

對話成功率達八成 媲美國際

為何選擇將人機介面相關技術,運用於電影搜尋?馮文生分析,電影領域的問答句型廣泛,而且涵蓋的詞彙甚多,對於建立語意理解與對話技術是個很好的試金石。同時,一般消費者使用智慧型手機的應用程式中,與電影搜尋相關的應用程式較少,更無運用人機介面相關技術的中文應用程式與系統,於是決定發展中文電影查詢口語問答系統,並藉此發展自然語言理解對話、非結構化文字處理、智慧化服務代理、高可擴充式介面等多項技術。

然而,大多數語言學家公認,中文因為語意多元,是最困難的語言,而中文同音字頗眾,發展人機介面相關技術的門檻,遠高於其他語言。除此,如何克服南腔北調等各路鄉音、處理規模龐大的巨量資料,並吸納電影族慣用的辭彙,也是相當龐雜、艱辛的工程。

先前的中文人機介面相關技術,只能辨識單字或較短的辭彙,但中文電影查詢口語問答系統卻可理解較長的語句,目前可查詢2000年起約十四年,共1萬4,000部電影資訊,針對內容與結果可進行多次互動詢答,一部伺服器可同時處理50 筆使用者問句,對話成功率已達88%,實為長足的進步。

馮文生說明,先前的人機介面相關技術,使用者僅能用幾組固定的辭彙,如「大聲」、「小聲」等,進行單純的語音命令,但因為電影查詢口語問答系統使用自然語言理解對話技術,智慧型手機使用者可用最自然的語句發問,如「我想找李安執導的電影」、「我想找周星馳主演的電影」等。

蒐羅影迷常用的一萬種句型

即使是「我想找由李安執導、周潤發主演的電影」等複雜語句,中文電影查詢口語問答系統也可快速、正確地處理;馮文生強調,其另一個優勢在於容錯,如使用者誤將「湯姆.克魯斯」唸成「湯姆.克魯蘇」,或只記得「湯姆.克魯」,依然可運轉不殆。甚至,將梁朝偉誤說成「臥虎藏龍」的男主角,系統可糾正為周潤發才是真正的男主角!

為了配合電影迷的搜尋習慣,中文電影查詢口語問答系統不僅可用導演、男女主角的名字查詢片名,也可將電影的類型、年代、發行國家當成關鍵字,用英文查詢也沒問題。馮文生補充道,可能有影迷只記得「阿湯哥」,忘記他的本名,依然可透過此系統查詢片名,工研院蒐集了電影迷常用的一萬多種句型,以豐富系統資料庫,強化語言理解、對話管理,精進其準確度。

「資料庫愈豐富,基於機械學習(machine learning)的原理,中文電影查詢口語問答系統準確度將愈來愈高,無論語音、語言、內容,皆是如此。」馮文生表示他與同仁皆不是語言學家,因此在解決困難時,採用工程學而非語言學的技術,「透過機械學習,此系統以可理解大多數使用者的斷句方式,不會誤解辭意。」

只是,在華人世界中,導演與男女演員相近或相同者所在多有;馮文生不諱言,中文電影查詢口語問答系統使用者若以李安為關鍵字,很快便可獲得正確答案,但若查詢另一個導演李岸,出現的可能還是李安所執導的電影,如何進一步擴充資料庫,使其更加完備,將是未來的重要課題。憑團隊20餘人的力量,也無法蒐羅大多數影迷常用的語句,與源源不斷的新辭彙,於是透過「群眾外包」(crowd souring)的方法,透過電影迷的群策群力,不斷充實、豐富電影查詢口語問答系統的資料庫。

可望隨Smart TV潮流風行

隨著3C產品邁向智慧化方向發展,智慧型行動裝置均內建語音介面,使用者可透過口語問答獲得資訊,簡化搜尋模式,掀起一股口說自然語言系統應用的契機。

工研院資訊與通訊研究所所長吳誠文表示,目前市場產品多半以短句語音辨識為主,自然語意理解能力有限;加上關鍵技術及專利多掌握在國外大廠,國內業者必須仰賴國外技術。因此工研院開發出國內第一套具對話能力「中文自然語意理解技術」,結合語音辨識、語言理解、對話管理、知識庫建構,在雲端系統及巨量資料的快速運算下,可理解使用者提出的敘述性問題回答正確內容,充分展現對自然語句高度理解能力,更能依據不同產業需求,擴充到不同的應用領域,進而與台灣手機大廠、系統業者、或服務業者結合,提供自主技術的自然語意理解人機介面或應用服務。

由於Siri為免費下載,類似軟體也不收費,但這不代表中文電影查詢口語問答系統不具商機。其商機是在各科技大廠正在積極研發、推廣的Smart TV;而人機介面相關專利已是國際大廠兵家必爭之地,除了與手機、電信業者合作,若能在國際間完整布局,專利授權的市場將相當可觀。

下載全文PDF Icon下載全文PDF


[{"text":"企業網","weight":13.0},{"text":"材化所","weight":11.5},{"text":"機械所","weight":10.0},{"text":"綠能所","weight":9.4},{"text":"生醫所","weight":8.0},{"text":"半導體","weight":6.2},{"text":"南分院","weight":5.0},{"text":"太陽能","weight":5.0},{"text":"課程","weight":5.0},{"text":"遠紅外線","weight":5.0},{"text":"雷射","weight":4.0},{"text":"LED","weight":4.0},{"text":"LED可見光","weight":3.0},{"text":"5G","weight":3.0},{"text":"工研人","weight":3.0},{"text":"電光所","weight":3.0},{"text":"綠能與環境研究所","weight":3.0},{"text":"機械","weight":3.0},{"text":"資通所","weight":2.0},{"text":"面板","weight":2.0},{"text":"文字轉語音","weight":2.0},{"text":"實習","weight":2.0},{"text":"無人機","weight":2.0},{"text":"生醫","weight":2.0},{"text":"3D","weight":2.0},{"text":"v2x","weight":2.0},{"text":"員工","weight":2.0},{"text":"地圖","weight":2.0},{"text":"太陽光電","weight":2.0},{"text":"材料與化工研究所","weight":1.0}]