

Ferramentas ИИ для StarCraft II para todas as ocasiões

Obtenha soluções ИИ для StarCraft II flexíveis que atendem a diversas demandas com eficiência.

ИИ для StarCraft II

mini-AlphaStar
Implementação simplificada do AlphaStar em PyTorch, permitindo treinamento de agentes RL em StarCraft II com arquitetura modular de rede e autojogo.

0


0
Visitar IA
O que é mini-AlphaStar?
mini-AlphaStar revela a arquitetura complexa do AlphaStar ao fornecer uma estrutura acadêmica, de código aberto, em PyTorch para desenvolvimento de IA em StarCraft II. Inclui codificadores de características espaciais para entradas de tela e minimapa, processamento de características não espaciais, módulos de memória LSTM e redes separadas de política e valor para seleção de ações e avaliação de estados. Utiliza aprendizagem por imitação para bootstrap e reforço com autojogo para ajuste fino, suportando wrappers de ambiente compatíveis com StarCraft II via pysc2, registro via TensorBoard e hiperparâmetros configuráveis. Pesquisadores e estudantes podem gerar conjuntos de dados de jogos humanos, treinar modelos em cenários personalizados, avaliar o desempenho do agente e visualizar curvas de aprendizado. A estrutura modular permite experimentação fácil com variantes de rede, cronogramas de treinamento e configurações multiagentes. Destinado à educação e prototipagem, não para implantação em produção.
Recursos Principais do mini-AlphaStar

Codificação de características espaciais e não espaciais

Módulos de memória LSTM

Redes separadas de política e valor

Pipeline de aprendizagem por imitação e reforço

Wrappers de ambiente para autojogo via pysc2

Registro e visualização no TensorBoard

Hiperparâmetros configuráveis

Código modular em PyTorch
StarCraft II Reinforcement Learning Agent
Um agente de aprendizado por reforço de código aberto que usa PPO para treinar e jogar StarCraft II via o ambiente PySC2 do DeepMind.

0


0
Visitar IA
O que é StarCraft II Reinforcement Learning Agent?
Este repositório fornece uma estrutura completa de aprendizado por reforço para pesquisa de jogabilidade em StarCraft II. O agente principal usa Proximal Policy Optimization (PPO) para aprender redes de política que interpretam dados de observação do ambiente PySC2 e geram ações precisas no jogo. Desenvolvedores podem configurar camadas de redes neurais, modelagem de recompensas e cronogramas de treinamento para otimizar o desempenho. O sistema suporta multiprocessamento para coleta eficiente de amostras, utilitários de registro para monitorar curvas de treinamento e scripts de avaliação para executar políticas treinadas contra oponentes scriptados ou IA incorporada. O código é escrito em Python e utiliza TensorFlow para definição e otimização de modelos. Usuários podem estender componentes como funções de recompensa personalizadas, pré-processamento de estado ou arquiteturas de rede para atender a objetivos de pesquisa específicos.
Recursos Principais do StarCraft II Reinforcement Learning Agent



Em Destaque

Ferramentas ИИ для StarCraft II para todas as ocasiões

Obtenha soluções ИИ для StarCraft II flexíveis que atendem a diversas demandas com eficiência.

ИИ для StarCraft II

mini-AlphaStar

StarCraft II Reinforcement Learning Agent