技術簡介
本報告書的目的,主要是作為視覺語言模型–以健康照護為應用的研究規格書,我們使用視覺語言模型加上帶有寵物健康知識之檢索增強生成技術,能精準回答寵物健康知識問題。
Abstract
The purpose of this document is to describe a report of Visual Language Model(VLM) - health and care as an application. We use visual language models combined with retrieval augmented generation technology with pet health knowledge to accurately answer questions about pet health knowledge.
技術規格
■ 安卓手機21.4.7075529
■ 本地端視覺語言模型: gemma-3 27b-it-quantized-W4A16
Technical Specification
■ Android SDK 21.4.7075529
■ LocalVLM Model
技術特色
針對寵物飼主進行VQA提問回覆
可結合現有智慧手機及現有寵物相機
應用範圍
寵物科技、互動產業、影視音產業、廣告業、智慧看板、高齡照護產業
接受技術者具備基礎建議(設備)
CPU: 12代Intel Core i5以上CPU處理器
GPU: 輝達RTX 5060 Ti 16G以上顯示卡
RAM: 建議64GB RAM記憶體
OS: Windows 10以上版本
接受技術者具備基礎建議(專業)
電機系、資訊系、資管系大學畢業懂軟體基本操作之人員
聯絡資訊
聯絡人:沈志聰 文化與運動科技服務組
電話:+886-3-5915229 或 Email:ct.shen@itri.org.tw
客服專線:+886-800-45-8899
傳真:+886-3-5915229