Herramientas resource collection más usadas

Descubre por qué estas herramientas resource collection son las favoritas de usuarios de todo el mundo.

resource collection

  • Marco de trabajo de código abierto basado en PyTorch que implementa la arquitectura CommNet para el aprendizaje por refuerzo multiagente con comunicación entre agentes que permite decisiones colaborativas.
    0
    0
    ¿Qué es CommNet?
    CommNet es una biblioteca orientada a la investigación que implementa la arquitectura CommNet, permitiendo que múltiples agentes compartan estados ocultos en cada paso temporal y aprendan a coordinar acciones en entornos cooperativos. Incluye definiciones de modelos en PyTorch, scripts de entrenamiento y evaluación, envoltorios para entornos OpenAI Gym y utilidades para personalizar canales de comunicación, conteo de agentes y profundidades de red. Investigadores y desarrolladores pueden usar CommNet para prototipar y evaluar estrategias de comunicación entre agentes en tareas de navegación, persecución-salvación y recolección de recursos.
    Características principales de CommNet
    • Implementación en PyTorch de la arquitectura CommNet
    • Módulo de comunicación de estados ocultos entre agentes
    • Capas de red configurables y conteo de agentes
    • Scripts de entrenamiento y evaluación
    • Envoltorios de entorno para OpenAI Gym
    • Utilidades de registro y puntos de control
  • Un entorno RL que simula múltiples mineros agentes cooperativos y competitivos que recopilan recursos en un mundo basado en una cuadrícula para el aprendizaje multiagente.
    0
    0
    ¿Qué es Multi-Agent Miners?
    Multi-Agent Miners ofrece un entorno de mundo en cuadrícula donde varios agentes mineros autónomos navegan, excavan y recogen recursos interactuando entre sí. Soporta tamaños de mapa configurables, número de agentes y estructuras de recompensa, permitiendo crear escenarios competitivos o cooperativos. El marco se integra con bibliotecas RL populares mediante PettingZoo, proporcionando APIs estandarizadas para funciones de reinicio, paso y renderizado. Los modos de visualización y soporte de registro ayudan a analizar comportamientos y resultados, siendo ideal para investigación, educación y benchmarking de algoritmos en aprendizaje por refuerzo multiagente.
Destacados