AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
pruebas de modelos en la nube
高評分pruebas de modelos en la nube工具
探索使用者最推薦的pruebas de modelos en la nube工具,以高效、穩定的解決方案提升您的工作品質。
pruebas de modelos en la nube
llm-tournament
一個開源的Python框架,用於協調大型語言模型之間的錦標賽,以實現自動性能比較。
0
0
訪問AI
llm-tournament 是什麼?
llm-tournament提供一個模塊化、可擴展的方法,用於大型語言模型的基準測試。用戶定義參賽者(LLMs),配置錦標賽分支,指定提示和評分邏輯,並運行自動回合。結果匯總到排行榜和可視化圖表,幫助基於數據做出與LLM相關的選擇和微調決策。該框架支持自訂任務定義、評估指標,以及在雲端或本地環境中進行批次執行。
llm-tournament 核心功能
自動對戰和錦標賽管理
可自定義的提示流程
可插拔的評分和評估函數
排行榜及排名生成
擴展插件架構
支持在雲端或本地批次執行
精選