RL-Benchmarks

Gym-Recsys
Gym-Recsys предоставляет настраиваемые окружения OpenAI Gym для масштабируемого обучения и оценки агентов рекомендаций с использованием обучения с подкреплением

0


0
Посетить ИИ
Что такое Gym-Recsys?
Gym-Recsys — это набор инструментов, который оборачивает задачи рекомендаций в окружения OpenAI Gym, позволяя алгоритмам обучения с подкреплением взаимодействовать с имитированными матрицами пользователь-объект шаг за шагом. Он обеспечивает синтетические генераторы поведения пользователя, поддерживает загрузку популярных наборов данных и поставляет стандартные метрики, такие как Precision@K и NDCG. Пользователи могут настраивать функции награды, модели пользователя и пул объектов для экспериментов с различными стратегиями рекомендаций на основе RL, с возможностью воспроизведения результатов.
Основные функции Gym-Recsys

Совместимые с OpenAI Gym рекомендации среды

Поддержка синтетических и реальных наборов данных

Модули симуляции поведения пользователя

Интеграция стандартных метрик рекомендаций

Настраиваемые пространства награды и наблюдения
RxAgent-Zoo
RxAgent-Zoo использует реактивное программирование с RxPY для упрощения разработки и экспериментов с модульными агентами усиленного обучения.

0


0
Посетить ИИ
Что такое RxAgent-Zoo?
В основе RxAgent-Zoo лежит реактивная RL-структура, которая рассматривает события данных из окружающей среды, буферы повторного воспроизведения и циклы обучения как наблюдаемые потоки. Пользователи могут цепочками операторов предобрабатывать наблюдения, обновлять сети и асинхронно регистрировать метрики. Библиотека поддерживает параллельную работу с окружающими средами, настраиваемые планировщики и интеграцию с популярными бенчмарками Gym и Atari. API "подключи и используй" позволяет бесшовно заменять компоненты агента, что способствует воспроизводимости, быстрому экспериментированию и масштабируемым рабочим потокам обучения.
Основные функции RxAgent-Zoo