最佳用戶評價的雲端模型測試工具 | Creati.ai

贊助商 Elser AI - 一體化網頁創作工作室，將文字與影像轉換為動畫風格藝術、角色、聲音與短片。

Elser AI - 一體化網頁創作工作室，將文字與影像轉換為動畫風格藝術、角色、聲音與短片。



雲端模型測試

llm-tournament
一個開源的Python框架，用於協調大型語言模型之間的錦標賽，以實現自動性能比較。

0


0
訪問AI
llm-tournament 是什麼？
llm-tournament提供一個模塊化、可擴展的方法，用於大型語言模型的基準測試。用戶定義參賽者（LLMs），配置錦標賽分支，指定提示和評分邏輯，並運行自動回合。結果匯總到排行榜和可視化圖表，幫助基於數據做出與LLM相關的選擇和微調決策。該框架支持自訂任務定義、評估指標，以及在雲端或本地環境中進行批次執行。
llm-tournament 核心功能

自動對戰和錦標賽管理

可自定義的提示流程

可插拔的評分和評估函數

排行榜及排名生成

擴展插件架構

支持在雲端或本地批次執行



精選