Gym-Recsys предоставляет настраиваемые окружения OpenAI Gym для масштабируемого обучения и оценки агентов рекомендаций с использованием обучения с подкреплением
Gym-Recsys — это набор инструментов, который оборачивает задачи рекомендаций в окружения OpenAI Gym, позволяя алгоритмам обучения с подкреплением взаимодействовать с имитированными матрицами пользователь-объект шаг за шагом. Он обеспечивает синтетические генераторы поведения пользователя, поддерживает загрузку популярных наборов данных и поставляет стандартные метрики, такие как Precision@K и NDCG. Пользователи могут настраивать функции награды, модели пользователя и пул объектов для экспериментов с различными стратегиями рекомендаций на основе RL, с возможностью воспроизведения результатов.
В основе RxAgent-Zoo лежит реактивная RL-структура, которая рассматривает события данных из окружающей среды, буферы повторного воспроизведения и циклы обучения как наблюдаемые потоки. Пользователи могут цепочками операторов предобрабатывать наблюдения, обновлять сети и асинхронно регистрировать метрики. Библиотека поддерживает параллельную работу с окружающими средами, настраиваемые планировщики и интеграцию с популярными бенчмарками Gym и Atari. API "подключи и используй" позволяет бесшовно заменять компоненты агента, что способствует воспроизводимости, быстрому экспериментированию и масштабируемым рабочим потокам обучения.