『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊

工業技術研究院

:::

技術名稱: 文件分群分類技術

技術簡介

文件分群與分類技術可自動將具有相似內容與語意之結構化或非結構化文章群聚與分類,此技術可應用於不同領域,例如:使用者興趣分析、事件追蹤、自動摘要等。

Abstract

Document clustering and classification technology can automatically group and categorize structured and unstructured data with similar context and semantic. This technique can be applied to different applications, such as user interest analysis, event tracking, and automatic summarization.

技術規格

‧中文文件分類正確率達70% ‧中文文件群聚排序索引達80%

Technical Specification

‧Accuracy of Chinese document classification>=70%. ‧RandIndex of Chinese document clustering>=80%.

技術特色

‧可處理多種文件格式(Word, PDF, XML, HTML, TXT), 以及中、英、繁、簡字體 ‧僅需提供分類範例,及分類架構,即可開始文件自動分類分群 ‧可提示類別特徵詞彙,以分析或瞭解文件分類過程 ‧可自動提示文件主題分佈

應用範圍

此技術為文字探勘重要核心技術,未來可應用於自然語言處理與人工智慧相關產業,提升產業價值。

接受技術者具備基礎建議(設備)

一般電腦系統

接受技術者具備基礎建議(專業)

‧文字探勘 ‧機器學習

技術分類 人機互動裝置及服務

聯絡資訊

聯絡人:李莉俁 執行長室

電話:+886-3-5916119 或 Email:villian.lee@itri.org.tw

客服專線:+886-800-45-8899

傳真:+886-3-5910257