- Унифицированный HTTP API для чата, дополнений и встраиваний
- Поддержка нескольких бэкендов (OpenAI, Azure, Vertex AI, локальные модели)
- Интеграция с векторными базами данных для поиска с усилением
- Пакетная обработка и кеширование
- Потоковые ответы токен за токеном
- Контроль доступа на основе ролей
- Экспорт метрик, совместимый с Prometheus