TAG(Table-Augmented Generation)是一個結合史丹佛與柏克萊大學創新思路的資料庫查詢框架,融合了 Text2SQL 和 RAG 的優勢。它包括三個關鍵步驟:查詢合成、查詢執行與答案生成,解決了以往方法無法處理的複雜查詢。
初版的 TAG 基準工具基於 BIRD Text2SQL 基準,並針對查詢進行了修改,加入了世界知識與語義推理的需求,使其超越單純的資料庫資料。查詢類型包括比對、比較、排序和聚合,共有 80 個查詢,其中 40 個需要模型具備參數知識,另 40 個則需進行推理。這樣的設計挑戰了大型語言模型(LLMs)的能力,特別是在處理隱含語義與複雜資料推理方面。
此框架的獨特之處在於,它不僅限於標準的資料庫查詢,還要求模型能夠結合額外的世界知識進行理解,對於語言模型的開發具有重要意義。
特色:
- 支援點查詢與聚合查詢等多種自然語言查詢。
- 可根據需求處理基於資料或推理的查詢。
- 支援多種資料模型與執行引擎。
- 透過生成模式提供準確且豐富的答案。
TAG 適用於商業智慧、數據分析、客服等需要自然語言查詢的應用場景,提升資料庫查詢的靈活性與準確度。