RL-Agents é uma estrutura de aprendizado por reforço de nível de pesquisa construída sobre PyTorch que reúne algoritmos populares de RL em métodos baseados em valor, política e ator-crítico. A biblioteca possui uma API modular de agentes, aceleração por GPU, integração perfeita com OpenAI Gym e ferramentas embutidas de registro e visualização. Os usuários podem configurar hiperparâmetros, personalizar ciclos de treinamento e fazer benchmarking de desempenho com algumas linhas de código, tornando RL-Agents ideal para pesquisa acadêmica, prototipagem e experimentação industrial.
A estrutura YGO-Agent permite que pesquisadores e entusiastas desenvolvam bots de IA que jogam o jogo de cartas Yu-Gi-Oh usando reforço de aprendizado. Ela encapsula o simulador de jogo YGOPRO em um ambiente compatível com OpenAI Gym, definindo representações de estado como mão, campo e pontos de vida, e representações de ação incluindo convocação, ativação de feitiço/armadilha e ataque. As recompensas são baseadas em resultados de vitória/derrota, dano causado e progresso no jogo. A arquitetura do agente usa PyTorch para implementar DQN, com opções para arquiteturas de rede personalizadas, replay de experiência e exploração epsilon-greedy. Módulos de registro gravam curvas de treinamento, taxas de vitória e logs detalhados de movimentos para análise. A estrutura é modular, permitindo que usuários substituam ou estendam componentes como a função de recompensa ou espaço de ação.