Die besten 代理導航-Lösungen für Sie

Finden Sie bewährte 代理導航-Tools, die sowohl für Anfänger als auch für Experten geeignet sind, und steigern Sie Ihre Produktivität.

代理導航

  • RL Shooter bietet eine anpassbare Doom-basierte Verstärkendes Lernumgebung zum Trainieren von KI-Agenten, um Ziele zu navigieren und zu schießen.
    0
    0
    Was ist RL Shooter?
    RL Shooter ist ein Python-basiertes Framework, das ViZDoom mit OpenAI Gym APIs integriert, um eine flexible Verstärkendes Lernumgebung für FPS-Spiele zu schaffen. Benutzer können benutzerdefinierte Szenarien, Karten und Belohnungsstrukturen definieren, um Agenten bei Navigation, Zielerkennung und Schießaufgaben zu trainieren. Mit anpassbaren Beobachtungsrahmen, Aktionsräumen und Protokollierungseinrichtungen unterstützt es beliebte Deep-RL-Bibliotheken wie Stable Baselines und RLlib, und ermöglicht klare Leistungsmessung und Reproduzierbarkeit in den Experimenten.
    RL Shooter Hauptfunktionen
    • Anpassbare FPS-Szenarien auf ViZDoom
    • Visuelle Frame-Observationsströme
    • Anpassbare Belohnungsfunktionen
    • Anpassbare Aktionsraumdefinitionen
    • Kompatibilität mit OpenAI Gym API
    • Frame-Skip und FPS-Steuerung
    • Protokollierung und TensorBoard-Unterstützung
  • Ein PyTorch-Framework, das Agenten ermöglicht, emergente Kommunikationsprotokolle in Multi-Agenten-Verstärkungslernaufgaben zu erlernen.
    0
    0
    Was ist Learning-to-Communicate-PyTorch?
    Dieses Repository implementiert emergente Kommunikation im Multi-Agenten-Verstärkungslernen mit PyTorch. Benutzer können neuronale Netzwerke für Sender und Empfänger konfigurieren, um referenzielle Spiele oder kooperative Navigation zu spielen, und so Agenten dazu ermutigen, einen diskreten oder kontinuierlichen Kommunikationskanal zu entwickeln. Es bietet Skripte für Training, Bewertung und Visualisierung gelernter Protokolle sowie Hilfsmittel für die Erstellung von Umgebungen, Nachrichtenkodierung und -decodierung. Forscher können es mit benutzerdefinierten Aufgaben erweitern, Netzarchitekturen anpassen und die Effizienz der Protokolle analysieren, um schnelle Experimente in emergenter Agentenkommunikation zu ermöglichen.
Ausgewählt