『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊 跳到 Cookie 設定

工業技術研究院

:::

技術名稱: 視覺語言模型

技術簡介

FullVision賦視眼鏡APP,結合國產AI晶片的邊緣運算能力與影像辨識技術,透過即時情境分析協助視障者進行障礙物偵測與環境資訊判讀,強化其在真實場域中的感知能力與安全性。FullVision賦視眼鏡APP進一步整合了工研院服科中心所建立的視障者服務系統及電光所開發的國產AI晶片邊緣運算裝置,實現軟硬整合的完整解決方案。

Abstract

The FullVision app uses domestic AI chips and image recognition to help the visually impaired detect obstacles and analyze environments in real-time. By integrating ITRI’s Service Robot system for the blind with advanced edge computing hardware, it provides a complete software-hardware solution that enhances user perception and safety in real-world settings.

技術規格

■ 安卓手機21.4.7075529 ■ 本地端視覺語言模型: gemma-3 27b-it-quantized-W4A16

Technical Specification

■ Android SDK 21.4.7075529 ■ LocalVLM Model: gemma-3 27b-it-quantized-W4A16

技術特色

 針對視障者進行VQA提問回覆  可結合現有智慧手機(宏達電)及現有智慧眼鏡(宏達電)

應用範圍

互動產業、影視音產業、廣告業、智慧看板、高齡照護產業

接受技術者具備基礎建議(設備)

CPU: 12代Intel Core i5以上CPU處理器 GPU: 輝達RTX 5060 Ti 16G以上顯示卡 RAM: 建議64GB RAM記憶體 OS: Windows 10以上版本

接受技術者具備基礎建議(專業)

電機系、資訊系、資管系大學畢業懂軟體基本操作之人員

技術分類 S-人機互動技術

聯絡資訊

聯絡人:沈志聰 文化與運動科技服務組

電話:+886-3-5915229 或 Email:ct.shen@itri.org.tw

客服專線:+886-800-45-8899

傳真:+886-3-5915229

舊工業技術研究院圖示