Мощные Algorithmus-Benchmarking инструменты

Algorithmus-Benchmarking

Emergent Communication in Agents
Открытая платформа PyTorch для многопользовательских систем, чтобы учиться и анализировать возникающие коммуникационные протоколы в задачах совместного обучения с подкреплением.

0


0
Посетить ИИ
Что такое Emergent Communication in Agents?
Возникающая коммуникация в агентах — это открытая платформа на PyTorch, предназначенная для исследователей, изучающих, как многопользовательские системы разрабатывают собственные протоколы связи. Библиотека предлагает гибкие реализации совместных задач обучения с подкреплением, включая референциальные игры, комбинированные игры и задачи идентификации объектов. Пользователи определяют архитектуры говорящих и слушающих агентов, задают свойства каналов сообщений, такие как размер словаря и длина последовательности, и выбирают стратегии обучения, такие как градиенты политики или контролируемое обучение. В рамках представлены скрипты для запуска экспериментов, анализа эффективности коммуникации и визуализации возникающих языков. Модульная конструкция обеспечивает лёгкое расширение новыми игровыми средами или пользовательскими функциями потерь. Исследователи могут воспроизводить опубликованные исследования, создавать эталонные модели новых алгоритмов и исследовать композиционность и семантику языков агентов.
Основные функции Emergent Communication in Agents

Реализации референциальных и комбинированных игр

Настраиваемые архитектуры говорящего и слушающего агента

Настраиваемые каналы сообщений (словарь, длина)

Поддержка градиентов политики и контролируемого обучения

Скрипты для полного цикла обучения и оценки

Инструменты визуализации для возникающих языков

Модульная структура для добавления новых сред
Multi-Agent Miners
Среда обучения с подкреплением, моделирующая несколько кооперативных и соревновательных агентов-горняков, собирающих ресурсы в мире на основе сетки для обучения мультиагентов.

0


0
Посетить ИИ
Что такое Multi-Agent Miners?
Multi-Agent Miners предоставляет среду мира в виде сетки, где несколько автономных минёров происходят навигацию, копают и собирают ресурсы, взаимодействуя друг с другом. Поддерживаются настраиваемые размеры карт, количество агентов и схемы награждения, что позволяет создавать как соревновательные, так и кооперативные сценарии. Интеграция с популярными библиотеками RL через PettingZoo обеспечивает стандартизированные API для функций сброса, шага и отображения. Режимы визуализации и журналирование помогают анализировать поведение и результаты, делая этот инструмент идеальным для исследований, обучения и бенчмаркинга алгоритмов в области мультиагентного обучения с усилением.
Основные функции Multi-Agent Miners
Cooperative Search Environment
Многопользовательская среда обучения с подкреплением на основе Python для совместного поиска с настраиваемой коммуникацией и вознаграждениями.

0


0
Посетить ИИ
Что такое Cooperative Search Environment?
Среда совместного поиска обеспечивает гибкую, совместимую с gym многопользовательскую среду обучения с подкреплением, предназначенную для задач совместного поиска как на дискретных сетках, так и в непрерывных пространствах. Агентов можно управлять при частичном наблюдении и обмениваться информацией в соответствии с настраиваемыми топологиями связи. Фреймворк поддерживает предопределенные сценарии, такие как поиск и спасение, отслеживание целей в динамике и совместное картографирование, предлагает API для определения пользовательских сценариев и структур наград. Интегрируется с популярными RL-библиотеками, такими как Stable Baselines3 и Ray RLlib, включает средства журналирования для анализа производительности и встроенные инструменты визуализации для мониторинга в реальном времени. Исследователи могут изменять размеры сеток, число агентов, диапазон сенсоров и механизмы обмена наградами для оценки стратегий координации и эффективной проверки новых алгоритмов.
Основные функции Cooperative Search Environment