『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊

工業技術研究院

:::

自然語言理解技術

技術簡介

自然語言理解技...(詳如圖說)
自然語言理解技術

自然語言是人與人溝通的主要媒介,主要有兩種型態:口說語言(語音)和手寫語言(文字)。交談就是人與人透過自然語言進行溝通的行為,因此也就有口談和筆談兩種型態。對應現代的通訊系統來進行遠距交談,就分別是語音通訊的電話、和文字通訊的簡訊或即時訊息(IM)。當交談的對象從人變成機器時,表示機器必須具備跟人一樣能夠以自然語言(語音/文字)進行溝通的能力,而這正是工研院「自然語言交談系統開發平台」所要提供的技術與服務。其中,最關鍵的技術就是如何讓機器聽懂語音或是讀懂文字,也就是所謂「自然語言理解技術」。

近年來國際大廠無一例外地分別推出自己的虛擬助理(VA),如Apple的Siri、Amazon的Alexa、Google的Google Assistant、Microsoft的Cortana、Samsung的Bixby等。其中的關鍵技術就是語音口談的能力。另外,因為社群網路帶動的即時通訊(IM)應用,也使得各大IM廠商(如Facebook Messenger、Line、WeChat等)紛紛推出具有筆談能力的文字聊天機器人,作為使用者與各種應用服務的溝通介面。這些潮流顯示:具有自然語言交談能力的虛擬機器人,將成為新世紀資通訊應用的使用者介面或服務入口。

特色與創新

有別於各大廠的技術,工研院提供的是語音口談和文字筆談一條龍開發服務,也就是一次設計、整合服務,這符合未來多媒體通訊的趨勢。我們更強調以下之定位與特色:

  • 優化垂直領域應用
    - 可客製化之文字轉語音:TTS
    - 可客製化之語音轉文字:STT
    - 語音文字通用語意理解:T2A(Text to Action)
    - 可設計編程之對話管理:PDM(Programmable Dialog Management)
    - 標準泛用型語音轉音標:STP(Speech to Phonetic-token)

  • 強化在地多語特色
    - 中英夾雜語音合成
    - 台語語音合成:國語翻台語(機器翻譯)+ 台語文字轉語音
    - 包含生活外來語之多語夾雜語音辨識
    - 包含專業術語之中外語夾雜語音辨識
    - 台語語音辨識