

Эффективные ゲームAI研究 решения

Используйте ゲームAI研究 инструменты с высокой производительностью для успешной работы.

ゲームAI研究

StarCraft II Reinforcement Learning Agent
Открытый агент обучения с подкреплением, использующий PPO для обучения и игры в StarCraft II через среду PySC2 от DeepMind.

0


0
Посетить ИИ
Что такое StarCraft II Reinforcement Learning Agent?
Данный репозиторий предоставляет полноценную рамочную платформу для исследований в области обучения с подкреплением в игре StarCraft II. Основной агент использует Proximal Policy Optimization (PPO) для обучения сетей политики, интерпретирующих данные наблюдений из среды PySC2 и выдающих точные действия в игре. Разработчики могут настраивать слои нейронных сетей, формирование вознаграждений и графики обучения для оптимизации производительности. Система поддерживает многопоточность для эффективного сбора образцов, утилиты логирования для мониторинга кривых обучения и скрипты оценки для тестирования обученных моделей против скриптованных или встроенных ИИ-оппонентов. Код написан на Python и использует TensorFlow для определения и оптимизации моделей. Пользователи могут расширять компоненты, такие как пользовательские функции вознаграждения, предварительная обработка состояния или архитектура сети, для достижения конкретных целей исследования.
Основные функции StarCraft II Reinforcement Learning Agent

Обучение политики на базе PPO в среде SC2

Интеграция с PySC2 от DeepMind для обработки состояний и действий

Настраиваемые архитектуры нейронных сетей и вознаграждения

Поддержка многопроцессорной обработки для параллельного сбора образцов

Логирование и интеграция с TensorBoard

Скрипты для оценки и сравнения агентов
BomberManAI
BomberManAI — это агент ИИ на базе Python, который самостоятельно ориентируется и борется в средах игры Bomberman, используя поисковые алгоритмы.

0


0
Посетить ИИ
Что такое BomberManAI?
BomberManAI — это агент ИИ, разработанный для автономной игры в классическую игру Bomberman. Написанный на Python, он взаимодействует с игровой средой, чтобы в реальном времени воспринимать состояние карты, доступные ходы и позиции соперников. Основной алгоритм сочетает поиск A*, поиск в ширину для анализа достижимости и эвристическую функцию оценки для определения оптимальных мест для установки бомб и стратегий уклонения. Агент управляет динамическими препятствиями, усилителями и несколькими противниками по различным макетам карт. Его модульная архитектура позволяет разработчикам экспериментировать с пользовательскими эвристиками, модулями обучения с усилением или альтернативными стратегиями принятия решений. Идеально подходит для исследователей игровой ИИ, студентов и разработчиков соревновательных ботов, BomberManAI предоставляет гибкую основу для тестирования и улучшения автономных игровых агентов.
Основные функции BomberManAI



Рекомендуемые

Эффективные ゲームAI研究 решения

Используйте ゲームAI研究 инструменты с высокой производительностью для успешной работы.

ゲームAI研究

StarCraft II Reinforcement Learning Agent

BomberManAI