MTEB Leaderboard：嵌入模型全方位評比與排行榜，方便選出適合的嵌入模型

網址

https://huggingface.co/spaces/mteb/leaderboard

2025-09-09 14:19:38

MTEB（Massive Text Embedding Benchmark）是一個專為文字嵌入模型設計的多任務跨語言評比平台，由 Hugging Face 提供支援與展示。藉由這個 Leaderboard，用戶能一目了然地比對不同模型在各類文本相關任務上的表現，協助選擇最適合自己應用場景的模型。

主要特色

全面性涵蓋：MTEB 包含 8 種任務類型與多達 56 或 58 個不同資料集，涵蓋分類 (Classification)、聚類 (Clustering)、序對分類 (Pair Classification)、重排序 (Reranking)、檢索 (Retrieval)、語意相似度 (STS)、摘要 (Summarization)、雙語文句挖掘 (Bitext Mining) 等多面向任務。
多語言支援：支援高達 112 種語言，使模型評估更具全球視野與應用多樣性。
豐富規模：累積超過 2,000 個實驗結果於排行榜中，具備龐大參考價值。
開源與參與性：提供完整開源程式碼與 GitHub 專案，鼓勵研究者與開發者自己基準測試與貢獻新模型或資料集。
實務應用價值高：MTEB 的多任務、多資料集設計，有助於選擇對特定應用（如語意搜尋、分群、摘要生成等）效能優異的模型。

使用 MTEB Leaderboard 時，你會發現它猶如模型性能的「全場景體檢中心」，可以從不同角度全面比較模型。舉例來說，有些模型在分類與語意相似度上表現亮眼，但在檢索任務卻未必突出；這種多面向比較有助判斷模型是否符合你的實際應用需求。

另外，排行榜頁面本身使用簡潔的 UI 和豐富排序功能，很適合快速瀏覽，而要提交模型評估也有完整的 GitHub 說明可循。不過有使用者反映，有時排行榜在 Hugging Face Spaces 上載的速度偏慢，甚至遇過執行錯誤的狀況，這時可以改用「Leaderboard 2 Demo」等更新版來瀏覽。