技術簡介
本系統是應用在單晶片上的小詞彙辨識技術。所需要的運算速度及系統資源與一般PC上的語音辨識系統相比,相對的小了許多,因此,非常適合應用在消費性電子產品上。
在傳統的應用上,小詞彙辨識系統在更換詞彙時,系統開發人員需重新收集語音資料及訓練出新的語音模型,造成系統的開發不便及成本上升。因此,本系統特別針對此問題進行改善,讓系統開發人員可挑選所需詞彙並直接進行語音模型的置換,大幅縮減系統開發所需時間。
Abstract
Speech recognition (SR) is the inter-disciplinary sub-field of computational linguistics which incorporates knowledge and research in the linguistics, computer science, and electrical engineering fields to develop methodologies and technologies that enables the recognition and translation of spoken language into text by computers and computerized devices such as those categorized as Smart Technologies and robotics. It is also known as "automatic speech recognition" (ASR), "computer speech recognition", or just "speech to text" (STT).
技術規格
中/英文語音辨識技術
*具有抗噪能力
*CSR BC-05,辨識模組運行於kalimba2 DSP
*Sample Rate: 8K Hz
*Sample Resolution: 16-bit
*Vocabulary -30 Commands
麥克風陣列噪音消除技術
以Cortex-M0為例
執行效能
0.174 Real-Time (13個中文命令)
記憶體需求
ROM:23,578 bytes
RAM: 4,396 bytes
辨識詞彙記憶體配置 (Byte)
‧ 1中文字約增加9Byte (on ROM)
Technical Specification
*CSR BC-05,kalimba2 DSP
*Sample Rate: 8K Hz
*Sample Resolution: 16-bit
*Vocabulary -30 Commands
技術特色
本系統可運用於DSP產品的聲控應用,依需求客制化語音指令,並利用麥克風陣列噪音消除技術提升辨識率。辨識模組運行於DSP(例如: kalimba2), 可與其它模組(例如:CSR藍牙模組)的運算不重疊,有效利用晶片效能。
應用範圍
語音指令辨識可在多種情境下應用,如語音互動玩具、語音家電控制、聲控家電遙控器...等情況。
接受技術者具備基礎建議(設備)
8051、DSP、ARM等具50MHz以上CPU平台
接受技術者具備基礎建議(專業)
具備DSP程式開發技能者
聯絡資訊
聯絡人:徐新怡 技術推廣組
電話:+886-3-5914757 或 Email:joycehsu@itri.org.tw
客服專線:+886-800-45-8899
傳真:+886-3-5910257