Ferramentas 代理導航 para todas as ocasiões

Obtenha soluções 代理導航 flexíveis que atendem a diversas demandas com eficiência.

代理導航

  • RL Shooter fornece um ambiente de aprendizagem por reforço personalizável baseado em Doom para treinar agentes de IA a navegar e atirar em alvos.
    0
    0
    O que é RL Shooter?
    RL Shooter é uma estrutura baseada em Python que integra ViZDoom com APIs do OpenAI Gym para criar um ambiente de aprendizagem por reforço flexível para jogos FPS. Os usuários podem definir cenários, mapas e estruturas de recompensa personalizadas para treinar agentes em tarefas de navegação, detecção de alvos e tiro. Com quadros de observação ajustáveis, espaços de ação e facilidades de registro, suporta bibliotecas populares de RL profundo como Stable Baselines e RLlib, permitindo acompanhamento claro de desempenho e reprodutibilidade entre experimentos.
    Recursos Principais do RL Shooter
    • Cenários FPS personalizáveis no ViZDoom
    • Transmissões de observação de quadro visual
    • Funções de recompensa configuráveis
    • Definições de espaço de ação ajustáveis
    • Compatibilidade com API do OpenAI Gym
    • Pulo de quadros e controle de FPS
    • Suporte a registros e TensorBoard
  • Uma estrutura PyTorch que permite que agentes aprendam protocolos de comunicação emergentes em tarefas de aprendizado por reforço multiagente.
    0
    0
    O que é Learning-to-Communicate-PyTorch?
    Este repositório implementa comunicação emergente em aprendizado por reforço multiagente usando PyTorch. Os usuários podem configurar redes neurais de emissores e receptores para jogar jogos referenciais ou navegação cooperativa, incentivando os agentes a desenvolver um canal de comunicação discreto ou contínuo. Oferece scripts para treinamento, avaliação e visualização dos protocolos aprendidos, além de utilitários para criação de ambientes, codificação e decodificação de mensagens. Pesquisadores podem expandi-lo com tarefas personalizadas, modificar arquiteturas de rede e analisar a eficiência do protocolo, promovendo experimentação rápida em comunicação emergente de agentes.
Em Destaque