- Объединённый API для нескольких языковых моделей
- Поддержка локальных и размещённых бэкэндов моделей
- Шаблоны запросов и управление пайплайнами
- Пакетная обработка и потоковая передача ответов
- Переключение между GPU и CPU
- Инструменты кеширования ответов и бенчмаркинга