PommerLearn позволяет исследователям и разработчикам обучать многоагентных RL-ботов в среде игры Pommerman. Включает готовые реализации популярных алгоритмов (PPO, DQN), гибкие конфигурационные файлы для гиперпараметров, автоматическое логирование и визуализацию метрик обучения, контрольные точки моделей и скрипты оценки. Его модульная архитектура облегчает расширение новыми алгоритмами, настройку среды и интеграцию с стандартными ML-библиотеками, такими как PyTorch.
Учебник Autogen для дебатов AI-агентов предоставляет пошаговую структуру для оркестровки нескольких AI-агентов, участвующих в структурированных дебатах. Он использует модуль AutoGen от LangChain для координации обмена сообщениями, выполнения инструментов и разрешения споров. Пользователи могут изменять шаблоны, настраивать параметры дебатов и просматривать подробные логи и сводки каждого раунда. Идеально для исследователей, оценивающих мнения моделей, или преподавателей, демонстрирующих сотрудничество AI. Этот учебник поставляет многоразовые компоненты кода для полноценной оркестровки дебатов на Python.