Мощные IA de jeu инструменты

IA de jeu

BomberManAI
BomberManAI — это агент ИИ на базе Python, который самостоятельно ориентируется и борется в средах игры Bomberman, используя поисковые алгоритмы.

0


0
Посетить ИИ
Что такое BomberManAI?
BomberManAI — это агент ИИ, разработанный для автономной игры в классическую игру Bomberman. Написанный на Python, он взаимодействует с игровой средой, чтобы в реальном времени воспринимать состояние карты, доступные ходы и позиции соперников. Основной алгоритм сочетает поиск A*, поиск в ширину для анализа достижимости и эвристическую функцию оценки для определения оптимальных мест для установки бомб и стратегий уклонения. Агент управляет динамическими препятствиями, усилителями и несколькими противниками по различным макетам карт. Его модульная архитектура позволяет разработчикам экспериментировать с пользовательскими эвристиками, модулями обучения с усилением или альтернативными стратегиями принятия решений. Идеально подходит для исследователей игровой ИИ, студентов и разработчиков соревновательных ботов, BomberManAI предоставляет гибкую основу для тестирования и улучшения автономных игровых агентов.
Основные функции BomberManAI
PommerLearn
Объемная RL-рамочная база, предлагающая инструменты обучения и оценки PPO, DQN для разработки сопернических агентов в игре Pommerman.

0


0
Посетить ИИ
Что такое PommerLearn?
PommerLearn позволяет исследователям и разработчикам обучать многоагентных RL-ботов в среде игры Pommerman. Включает готовые реализации популярных алгоритмов (PPO, DQN), гибкие конфигурационные файлы для гиперпараметров, автоматическое логирование и визуализацию метрик обучения, контрольные точки моделей и скрипты оценки. Его модульная архитектура облегчает расширение новыми алгоритмами, настройку среды и интеграцию с стандартными ML-библиотеками, такими как PyTorch.
Основные функции PommerLearn
VMAS
VMAS — это модульная система обучения с усилением для многопроцессорных агентов, позволяющая моделировать и обучать мультиагентные системы с использованием встроенных алгоритмов и аппаратного ускорения GPU.

0


0
Посетить ИИ
Что такое VMAS?
VMAS — полный набор инструментов для построения и обучения мультиагентных систем с помощью глубокого обучения с подкреплением. Он обеспечивает параллельное моделирование сотен экземпляров окружений на GPU, что позволяет собирать данные с высокой пропускной способностью и масштабировать обучение. VMAS включает реализации популярных алгоритмов MARL, таких как PPO, MADDPG, QMIX и COMA, и предлагает модульные интерфейсы для быстрой прототипизации политики и среды. Фреймворк позволяет организовать централизованное обучение с децентрализованным исполнением (CTDE), поддерживаемые настраиваемые наградные функции, пространства наблюдения и хуки обратных вызовов для ведения журналов и визуализации. Благодаря модульной архитектуре VMAS легко интегрируется с моделями PyTorch и внешними средами, что делает его идеальным для исследований в задачах сотрудничества, соревнований и смешанных мотиваций в робототехнике, управлении трафиком, распределении ресурсов и сценариях игровой AI.
Основные функции VMAS
DQN-Deep-Q-Network-Atari-Breakout-TensorFlow
Открытое исходное TensorFlow-основанный агент Deep Q-Network, обучающийся играть в Atari Breakout с использованием воспроизведения опыта и целевых сетей.

0


0
Посетить ИИ
Что такое DQN-Deep-Q-Network-Atari-Breakout-TensorFlow?
DQN-Deep-Q-Network-Atari-Breakout-TensorFlow обеспечивает полную реализацию алгоритма DQN, адаптированную для среды Atari Breakout. Использует сверточную нейронную сеть для приближения Q-значений, применяет воспроизведение опыта для разрыва корреляций между последовательными наблюдениями и используют периодически обновляемую целевую сеть для стабилизации обучения. Агент действует по epsilon-greedy политике для исследования и может обучаться с нуля на необработанных пиксельных входных данных. В репозитории есть файлы конфигурации, скрипты обучения для мониторинга роста наград, тестовые скрипты для проверки обученных моделей и утилиты TensorBoard для визуализации метрик обучения. Пользователи могут настраивать гиперпараметры, такие как скорость обучения, размер буфера воспроизведения и размер пакета, для экспериментирования с разными настройками.
Основные функции DQN-Deep-Q-Network-Atari-Breakout-TensorFlow