『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊 跳到 Cookie 設定

工業技術研究院

:::

技術名稱: 視覺語言模型–以健康照護為應用

技術簡介

本報告書的目的,主要是作為視覺語言模型–以健康照護為應用的研究規格書,我們使用視覺語言模型加上帶有寵物健康知識之檢索增強生成技術,能精準回答寵物健康知識問題。

Abstract

The purpose of this document is to describe a report of Visual Language Model(VLM) - health and care as an application. We use visual language models combined with retrieval augmented generation technology with pet health knowledge to accurately answer questions about pet health knowledge.

技術規格

■ 安卓手機21.4.7075529 ■ 本地端視覺語言模型: gemma-3 27b-it-quantized-W4A16

Technical Specification

■ Android SDK 21.4.7075529 ■ LocalVLM Model

技術特色

 針對寵物飼主進行VQA提問回覆  可結合現有智慧手機及現有寵物相機

應用範圍

寵物科技、互動產業、影視音產業、廣告業、智慧看板、高齡照護產業

接受技術者具備基礎建議(設備)

CPU: 12代Intel Core i5以上CPU處理器 GPU: 輝達RTX 5060 Ti 16G以上顯示卡 RAM: 建議64GB RAM記憶體 OS: Windows 10以上版本

接受技術者具備基礎建議(專業)

電機系、資訊系、資管系大學畢業懂軟體基本操作之人員

技術分類 S-人機互動技術

聯絡資訊

聯絡人:沈志聰 文化與運動科技服務組

電話:+886-3-5915229 或 Email:ct.shen@itri.org.tw

客服專線:+886-800-45-8899

傳真:+886-3-5915229

舊工業技術研究院圖示