Данное репозитории реализует появляющуюся коммуникацию в задачах обучения с подкреплением для нескольких агентов с помощью PyTorch. Пользователи могут настроить нейронные сети для отправителей и получателей для игры в референциальные игры или совместную навигацию, побуждая агентов развивать дискретный или непрерывный канал связи. Включены скрипты для обучения, оценки и визуализации изученных протоколов, а также утилиты для создания окружений, кодирования и декодирования сообщений. Исследователи могут расширять их пользовательскими задачами, изменять архитектуру сетей и анализировать эффективность протоколов, что способствует быстрому экспериментированию в области появления коммуникации агентов.
Реализация Multi-Agent Deep Deterministic Policy Gradient на базе Keras для кооперативного и соревновательного многопроAgentного обучения с подкреплением.
MADDPG-Keras обеспечивает полный каркас для исследований в области обучения с подкреплением с несколькими агентами, реализуя алгоритм MADDPG в Keras. Поддерживаются непрерывные пространства действий, несколько агентов и стандартные среды OpenAI Gym. Исследователи и разработчики могут настраивать архитектуры нейронных сетей, гиперпараметры обучения и функции вознаграждения, после чего запускать эксперименты с встроенным логированием и контрольными точками для ускорения обучения политик и оценки производительности.
Приложение Science позволяет пользователям анализировать любое утверждение как с поддерживающими, так и с противоположными доказательствами, полученными из рецензируемых научных исследований. Используя ИИ для поиска научных статей, оно связывает пользователей напрямую с источниками, предоставляя сбалансированный анализ силы доказательств и научного консенсуса. Платформа предназначена для помощи исследователям в упрощении процесса литературного обзора, а также предлагает широкой публике доступ к основанной на фактических данных информации в доступном формате.