- Paso 1: Instala el paquete con pip install dead-simple-self-learning
- Paso 2: Importa el marco y inicializa el entorno
- Paso 3: Define o selecciona un modelo de política
- Paso 4: Configura los parámetros de entrenamiento e instancia el entrenador
- Paso 5: Ejecuta el bucle de entrenamiento y monitorea el progreso
- Paso 6: Evalúa el agente entrenado y visualiza los resultados