- Passo 1: Instale o pacote usando pip install dead-simple-self-learning
- Passo 2: Importe a estrutura e inicialize o ambiente
- Passo 3: Defina ou selecione um modelo de política
- Passo 4: Configure os parâmetros de treinamento e crie o treinador
- Passo 5: Execute o loop de treinamento e monitore o progresso
- Passo 6: Avalie o agente treinado e visualize os resultados