Die neuesten 強化学習-Lösungen 2024

Nutzen Sie die neuesten 強化学習-Tools, die 2024 auf den Markt gekommen sind, um Ihrer Konkurrenz einen Schritt voraus zu sein.

強化学習

  • Jason-RL rüstet Jason BDI-Agenten mit Reinforcement-Learning aus, was eine adaptive Entscheidungsfindung basierend auf Q-Learning und SARSA durch Belohnungserfahrung ermöglicht.
    0
    0
    Was ist jason-RL?
    Jason-RL fügt dem Jason Multi-Agenten-Framework eine Verstärkendes Lernen-Schicht hinzu, die es AgentSpeak-BDI-Agenten ermöglicht, Aktions-Auswahl-Politiken durch Belohnungsfeedback zu erlernen. Es implementiert Q-Learning und SARSA, unterstützt die Konfiguration von Lernparametern (Lernrate, Diskontfaktor, Explorationsstrategie) und protokolliert Trainingsmetriken. Durch die Definition von Belohnungsfunktionen in Agentenplänen und das Ausführen von Simulationen können Entwickler beobachten, wie Agenten im Laufe der Zeit Entscheidungsfindung verbessern und sich an sich ändernde Umgebungen anpassen, ohne manuell Politiken zu codieren.
  • MARFT ist ein Open-Source-Toolkit für Multi-Agenten-Reinforcement-Learning (RL) zur Feinabstimmung für kollaborative KI-Workflows und Optimierung von Sprachmodellen.
    0
    0
    Was ist MARFT?
    MARFT ist ein in Python entwickeltes LLM, das reproduzierbare Experimente und schnelle Prototypentwicklung für kollaborative KI-Systeme ermöglicht.
  • Eine Open-Source-Minecraft-inspirierte RL-Plattform, die KI-Agenten ermöglicht, komplexe Aufgaben in anpassbaren 3D-Sandbox-Umgebungen zu erlernen.
    0
    0
    Was ist MineLand?
    MineLand stellt eine flexible 3D-Sandbox-Umgebung inspiriert von Minecraft bereit, um Verstärkungslern-Agenten zu trainieren. Es verfügt über Gym-kompatible APIs für nahtlose Integration mit bestehenden RL-Bibliotheken wie Stable Baselines, RLlib und eigenen Implementierungen. Nutzer erhalten Zugriff auf eine Bibliothek von Aufgaben, darunter Ressourcensammlung, Navigation und Konstruktionsherausforderungen, jede mit konfigurierbarer Schwierigkeit und Belohnungsstruktur. Echtzeit-Rendering, Multi-Agenten-Szenarien und Headless-Modi ermöglichen skalierbares Training und Benchmarking. Entwickler können neue Karten entwerfen, eigene Belohnungsfunktionen definieren und zusätzliche Sensoren oder Steuerungen integrieren. MineLand’s Open-Source-Codebasis fördert reproduzierbare Forschung, kollaborative Entwicklung und schnelles Prototyping von KI-Agenten in komplexen virtuellen Welten.
  • Vereinfachte PyTorch-Implementierung von AlphaStar, die das Training eines StarCraft II RL-Agenten mit modularer Netzwerkarchitektur und Selbstspiel ermöglicht.
    0
    0
    Was ist mini-AlphaStar?
    mini-AlphaStar entmystifiziert die komplexe AlphaStar-Architektur durch die Bereitstellung eines zugänglichen, Open-Source-PyTorch-Frameworks für die StarCraft II KI-Entwicklung. Es verfügt über räumliche Feature-Encoder für Bildschirm- und Minimap-Inputs, nicht-raumbezogene Feature-Verarbeitung, LSTM-Speicher-Module sowie separate Policy- und Wert-Netzwerke für Aktionsauswahl und Zustandsbewertung. Durch Imitationslernen für den Start und Reinforcement Learning mit Selbstspiel zur Feinabstimmung unterstützt es Umgebungs-Wrapper, die mit pysc2 kompatibel sind, Logging via TensorBoard und konfigurierbare Hyperparameter. Forscher und Studenten können Datensätze aus menschlichem Gameplay erstellen, Modelle auf benutzerdefinierten Szenarien trainieren, die Agentenleistung bewerten und Lernkurven visualisieren. Die modulare Codebasis ermöglicht einfache Experimente mit Varianten von Netzwerken, Trainingsplänen und Multi-Agent-Setups. Konzipiert für Bildung und Prototyping, nicht für den Produktionseinsatz.
  • Eine auf Unity ML-Agents basierende Umgebung zur Schulung kooperativer Multi-Agenten-Inspektionsaufgaben in anpassbaren 3D-virtuellen Szenarien.
    0
    0
    Was ist Multi-Agent Inspection Simulation?
    Multi-Agent Inspection Simulation bietet ein umfassendes Framework zur Simulation und Schulung mehrerer autonomer Agenten, die Inspektionsaufgaben in Unity 3D-Umgebungen kooperativ ausführen. Es integriert sich mit dem Unity ML-Agents-Toolkit und bietet konfigurierbare Szenen mit Inspektionszielen, anpassbaren Belohnungsfunktionen und Agentenverhaltensparametern. Forscher können benutzerdefinierte Umgebungen skripten, die Anzahl der Agenten definieren und Trainingspläne über Python-APIs festlegen. Das Paket unterstützt parallele Trainingssitzungen, TensorBoard-Logging und anpassbare Beobachtungen, einschließlich Raycasts, Kamerafeeds und Positionsdaten. Durch Anpassung der Hyperparameter und der Komplexität der Umgebung können Benutzer Verstärkungslern-Algorithmen anhand von Abdeckung, Effizienz und Koordinationsmetriken benchmarken. Der Open-Source-Code fördert die Erweiterung für Robotik-Prototypen, kooperative KI-Forschung und Bildungsdemonstrationen im Bereich Multi-Agenten-Systeme.
  • Open-Source Python-Umgebung zum Trainieren von KI-Agenten für die kooperative Überwachung und Erkennung von Eindringlingen in gitterbasierten Szenarien.
    0
    0
    Was ist Multi-Agent Surveillance?
    Multi-Agent Surveillance bietet einen flexiblen Simulationsrahmen, in dem mehrere KI-Agenten als Räuber oder Verfolger in einer diskreten Gitterwelt agieren. Benutzer können Umgebungsparameter wie Gitterabmessungen, Anzahl der Agenten, Erkennungsradien und Belohnungsstrukturen konfigurieren. Das Repository umfasst Python-Klassen für das Verhalten der Agenten, Szenarien-Generierungsskripte, integrierte Visualisierung mittels matplotlib und nahtlose Integration mit beliebten Verstärkungslernen-Bibliotheken. Dies erleichtert die Benchmarking von Multi-Agenten-Koordination, die Entwicklung maßgeschneiderter Überwachungsstrategien und die Durchführung reproduzierbarer Experimente.
  • Eine Open-Source-Python-Simulationsumgebung zur Schulung der kooperativen Drohnenschwarmkontrolle mit Multi-Agenten-Verstärkendem Lernen.
    0
    0
    Was ist Multi-Agent Drone Environment?
    Multi-Agent-Drohnenumgebung ist ein Python-Paket, das eine anpassbare Multi-Agenten-Simulation für UAV-Schwärme bietet, basierend auf OpenAI Gym und PyBullet. Nutzer definieren mehrere Drohnenagenten mit kinematischen und dynamischen Modellen, um kooperative Aufgaben wie Formationsflug, Zielverfolgung und Hindernisvermeidung zu erforschen. Die Umgebung unterstützt modulare Aufgaben konfigurieren, realistische Kollisionsdetektion und Sensor-Emulation, während benutzerdefinierte Belohnungsfunktionen und dezentrale Policies ermöglicht werden. Entwickler können ihre eigenen Verstärkendem-Lernen-Algorithmen integrieren, die Leistung unter verschiedenen Szenarien bewerten und Agentenverläufe sowie Metriken in Echtzeit visualisieren. Das Open-Source-Design fördert Community-Beiträge und ist ideal für Forschung, Lehre und Prototyping fortschrittlicher Multi-Agenten-Steuerungslösungen.
  • Koordiniert mehrere autonome Abfallsammler mithilfe von Verstärkendem Lernen, um Sammelrouten effizient zu optimieren.
    0
    0
    Was ist Multi-Agent Autonomous Waste Collection System?
    Das Multi-Agenten-Autonomous Waste Collection System ist eine forschungsbasierte Plattform, die Multi-Agenten-Verstärkendes Lernen einsetzt, um einzelne Abfallsammelroboter im Routenkonflikt zu trainieren. Die Agenten lernen, redundante Abdeckung zu vermeiden, die Fahrstrecke zu minimieren und auf dynamische Abfallmuster zu reagieren. Das System ist in Python entwickelt und integriert eine Simulationsumgebung zur Testung und Verfeinerung der Richtlinien vor dem echten Einsatz. Nutzer können Kartenlayouts, Abfallentsorgungsstellen, Sensoreinstellungen der Agenten und Belohnungsstrukturen konfigurieren, um das Verhalten an spezifische urbane Bereiche oder Betriebsbeschränkungen anzupassen.
  • Implementiert dezentrales Multi-Agent-DDPG-Verstärkungslernen mit PyTorch und Unity ML-Agents für kollaboratives Agententraining.
    0
    0
    Was ist Multi-Agent DDPG with PyTorch & Unity ML-Agents?
    Dieses Open-Source-Projekt liefert ein vollständiges Multi-Agent-Verstärkungslernen-Framework, das auf PyTorch und Unity ML-Agents basiert. Es bietet dezentrale DDPG-Algorithmen, Umgebungs-Wrapper und Trainingsskripte. Nutzer können Agentenrichtlinien, Kritiker-Netzwerke, Replay-Puffer und parallele Trainings-Worker konfigurieren. Log-Hooks ermöglichen die Überwachung mit TensorBoard, während modulare Code-Strukturen benutzerdefinierte Belohnungsfunktionen und Umgebungsparameter unterstützen. Das Repository umfasst Beispiel-Szenen in Unity, die kollaborative Navigationsaufgaben demonstrieren, und ist damit ideal, um Multi-Agent-Szenarien in Simulationen zu erweitern und zu benchmarking.
  • Open-Source-Mult-Agent-KI-Framework für kollaboratives Objekt-Tracking in Videos unter Verwendung von Deep Learning und verstärkter Entscheidungsfindung.
    0
    0
    Was ist Multi-Agent Visual Tracking?
    Multi-Agent Visual Tracking implementiert ein verteiltes Tracking-System, das aus intelligenten Agenten besteht, die kommunizieren, um Genauigkeit und Robustheit bei der Video-Objektverfolgung zu verbessern. Agenten führen Faltungsneuronennetze für die Erkennung aus, teilen Beobachtungen zur Handhabung von Occlusions und passen Tracking-Parameter durch Verstärkungslernen an. Kompatibel mit gängigen Videodatensätzen, unterstützt es sowohl Training als auch Echtzeit-Inferenz. Nutzer können es einfach in bestehende Pipelines integrieren und Verhaltensweisen der Agenten für individuelle Anwendungen erweitern.
  • Eine Open-Source-Mehragenten-Reinforcement-Learning-Framework, das Rohsteuerung und Koordination von Agenten in StarCraft II über PySC2 ermöglicht.
    0
    0
    Was ist MultiAgent-Systems-StarCraft2-PySC2-Raw?
    MultiAgent-Systems-StarCraft2-PySC2-Raw bietet ein vollständiges Toolkit zum Entwickeln, Trainieren und Bewerten mehrerer KI-Agenten in StarCraft II. Es stellt Low-Level-Kontrollen für Einheitenbewegung, Zielverfolgung und Fähigkeiten bereit und erlaubt gleichzeitig eine flexible Belohnungs- und Szenarienkonfiguration. Nutzer können eigene neuronale Netzwerkarchitekturen integrieren, Team-Strategien definieren und Metriken aufzeichnen. Basierend auf PySC2 unterstützt es paralleles Training, Checkpointing und Visualisierung, was es ideal für Forschung im Bereich kooperatives und adversariales multi-agenten Reinforcement Learning macht.
  • Ein auf Python basierendes Multi-Agenten-Verstärkungslernen-Framework zur Entwicklung und Simulation kooperativer und kompetitiver KI-Agenten-Umgebungen.
    0
    0
    Was ist Multiagent_system?
    Multiagent_system bietet ein umfassendes Werkzeugset zum Erstellen und Verwalten von Multi-Agenten-Umgebungen. Nutzer können benutzerdefinierte Simulationsszenarien definieren, Agentenverhalten spezifizieren und vorimplementierte Algorithmen wie DQN, PPO und MADDPG verwenden. Das Framework unterstützt synchrones und asynchrones Training, wobei Agenten gleichzeitig oder abwechselnd interagieren können. Eingebaute Kommunikationsmodule erleichtern das Nachrichtenversand zwischen Agenten für Kooperationsstrategien. Die Konfiguration von Experimenten erfolgt vereinfacht über YAML-Dateien, und Ergebnisse werden automatisch in CSV oder TensorBoard protokolliert. Visualisierungsskripte helfen bei der Interpretation von Agentenbewegungen, Belohnungsentwicklung und Kommunikationsmustern. Für Forschungs- und Produktionsarbeit entwickelt, skaliert Multiagent_system nahtlos von Einzelmaschinen-Prototypen bis hin zu verteilter Schulung auf GPU-Clustern.
  • Ein auf Python basierendes Multi-Agenten-Simulationsframework, das gleichzeitige Zusammenarbeit, Wettbewerb und Schulung von Agenten in anpassbaren Umgebungen ermöglicht.
    0
    1
    Was ist MultiAgentes?
    MultiAgentes bietet eine modulare Architektur zur Definition von Umgebungen und Agenten, die synchrone und asynchrone Multi-Agenten-Interaktionen unterstützt. Es umfasst Basisklassen für Umgebungen und Agenten, vordefinierte Szenarien für kooperative und wettbewerbsorientierte Aufgaben, Werkzeuge zur Anpassung von Belohnungsfunktionen und APIs für die Kommunikation zwischen Agenten und die Beobachtungsteilung. Visualisierungs utils ermöglichen die Echtzeitüberwachung des Agentenverhaltens, während Logger-Module Leistungsmetriken aufzeichnen. Das Framework integriert sich nahtlos mit Gym-kompatiblen Reinforcement-Learning-Bibliotheken, sodass Nutzer Agenten mit bestehenden Algorithmen trainieren können. MultiAgentes ist auf Erweiterbarkeit ausgelegt, sodass Entwickler neue Umgebungsvorlagen, Agententypen und Kommunikationsprotokolle hinzufügen können, um vielfältige Forschungs- und Bildungsanwendungen abzudecken.
  • Open-Source-Framework zur Implementierung und Bewertung multi-agentenbasierter KI-Strategien in einer klassischen Pacman-Spielumgebung.
    0
    0
    Was ist MultiAgentPacman?
    MultiAgentPacman bietet eine in Python geschriebene Spielumgebung, in der Benutzer mehrere KI-Agenten im Pacman-Bereich implementieren, visualisieren und benchmarken können. Es unterstützt Adversarial Search-Algorithmen wie Minimax, Expectimax, Alpha-Beta sowie eigene Verstärkungslern- oder heuristische Agenten. Das Framework umfasst eine einfache GUI, Befehlszeilesteuerung und Tools zur Protokollierung von Spieldaten und Leistungsvergleich zwischen Agenten in Wettbewerbs- oder Kooperationsszenarien.
  • Eine Open-Source-Python-Framework, das die Gestaltung, das Training und die Bewertung von kooperativen und wettbewerbsorientierten Multi-Agenten-Verstärkungslernen-Systemen ermöglicht.
    0
    0
    Was ist MultiAgentSystems?
    MultiAgentSystems wurde entwickelt, um den Prozess des Aufbaus und der Bewertung von Multi-Agenten-Verstärkungslern-Anwendungen (MARL) zu vereinfachen. Die Plattform umfasst Implementierungen modernster Algorithmen wie MADDPG, QMIX, VDN sowie zentrale Schulung mit dezentraler Ausführung. Es bietet modulare Umgebungs-Wrapper, die mit OpenAI Gym kompatibel sind, Kommunikationsprotokolle für die Interaktion von Agenten sowie Protokollierungsfunktionen zur Verfolgung von Metriken wie Belohnungsformung und Konvergenzraten. Forscher können Agentenarchitekturen anpassen, Hyperparameter abstimmen und Szenarien wie kooperative Navigation, Ressourcenallokation und Adversarial-Spiele simulieren. Mit integrierter Unterstützung für PyTorch, GPU-Beschleunigung und TensorBoard-Integration beschleunigt MultiAgentSystems Experimente und Benchmarking in kollaborativen und wettbewerbsorientierten Multi-Agenten-Bereichen.
  • Ein Verstärkendes Lernframework zum Trainieren kollisionsfreier Mehrrobotik-Navigationsrichtlinien in simulierten Umgebungen.
    0
    0
    Was ist NavGround Learning?
    NavGround Learning stellt ein umfassendes Werkzeugset für die Entwicklung und Benchmarking von Verstärkendem Lernen-Agenten bei Navigationsaufgaben bereit. Es unterstützt Multi-Agenten-Simulationen, Kollisionsmodellierung sowie anpassbare Sensoren und Aktuatoren. Benutzer können aus vorgefertigten Policy-Vorlagen wählen oder eigene Architekturen implementieren, mit modernen RL-Algorithmen trainieren und Leistungsmetriken visualisieren. Die Integration mit OpenAI Gym und Stable Baselines3 vereinfacht das Experimentiormanagement, während integrierte Logging- und Visualisierungstools eine tiefgehende Analyse des Agentenverhaltens und der Trainingsdynamik ermöglichen.
  • OpenSpiel bietet eine Bibliothek von Umgebungen und Algorithmen für die Forschung im Bereich Reinforcement Learning und spieltheoretische Planung.
    0
    0
    Was ist OpenSpiel?
    OpenSpiel ist ein Forschungsrahmen, der eine Vielzahl von Umgebungen bereitstellt (von einfachen Matrixspielen bis hin zu komplexen Brettspielen wie Schach, Go und Poker) und verschiedene Reinforcement-Learning- und Suchalgorithmen implementiert (z.B. Wertiteration, Policy-Gradient-Methoden, MCTS). Sein modulares C++-Kernstück und Python-Bindings ermöglichen es Nutzern, eigene Algorithmen zu integrieren, neue Spiele zu definieren und Leistungen anhand standardisierter Benchmarks zu vergleichen. Für Erweiterbarkeit konzipiert, unterstützt es einzelne und multi-agenten Szenarien, um kooperative und wettbewerbsorientierte Situationen zu untersuchen. Forscher nutzen OpenSpiel, um Algorithmen schnell zu prototypisieren, groß angelegte Experimente durchzuführen und reproduzierbaren Code zu teilen.
  • Pits and Orbs bietet eine Multi-Agenten-Gitterswelt, in der KI-Agenten Fallen meiden, Orbs sammeln und in rundenbasierten Szenarien konkurrieren.
    0
    0
    Was ist Pits and Orbs?
    Pits and Orbs ist eine Open-Source-Umgebung für Verstärkendes Lernen, implementiert in Python, die eine rundenbasierte Multi-Agenten-Gitterswelt bietet, in der Agenten Zielsetzungen verfolgen und Umweltgefahren begegnen. Jeder Agent muss ein anpassbares Gitter navigieren, zufällig platzierte Fallen meiden, die Episoden bestrafen oder beenden, und Orbs für positive Belohnungen sammeln. Die Umgebung unterstützt sowohl Wettbewerbs- als auch Kooperationsmodi, sodass Forscher verschiedene Lernszenarien erkunden können. Ihre einfache API integriert sich nahtlos mit beliebten RL-Bibliotheken wie Stable Baselines oder RLlib. Zu den Hauptmerkmalen gehören anpassbare Gittergrößen, dynamische Fallen- und Orb-Verteilungen, konfigurierbare Belohnungsstrukturen und optionales Logging für das Trainings-Tracking.
  • Ein Python-Framework, das die Entwicklung und das Training von KI-Agenten zur Teilnahme an Pokémon-Kämpfen mithilfe von Verstärkendem Lernen ermöglicht.
    0
    1
    Was ist Poke-Env?
    Poke-Env wurde entwickelt, um die Erstellung und Bewertung von KI-Agenten für Pokémon-Showdown-Kämpfe durch eine umfassende Python-Schnittstelle zu vereinfachen. Es verwaltet die Kommunikation mit dem Pokémon-Showdown-Server, analysiert Spieldaten und steuert Zug-Entscheidungen durch eine ereignisgetriebene Architektur. Benutzer können Basisklassen für Spieler erweitern, um benutzerdefinierte Strategien mit Verstärkendem Lernen oder heuristischen Algorithmen umzusetzen. Das Framework bietet integrierte Unterstützung für Kampf-Simulationen, parallele Matches und detailliertes Logging von Aktionen, Belohnungen und Ergebnissen für reproduzierbare Forschung. Durch die Abstraktion niederen Netzwerk- und Parsing-Aufgaben ermöglicht Poke-Env Forschern und Entwicklern, sich auf Algorithmendesign, Leistungstuning und vergleichende Benchmarking von Strategien zu konzentrieren.
  • PyBrain: Modulare, Python-basierte Bibliothek für maschinelles Lernen und neuronale Netzwerke.
    0
    0
    Was ist pybrain.org?
    PyBrain, die Abkürzung für Python-Based Reinforcement Learning, Artificial Intelligence, and Neural Networks Library, ist eine modulare und Open-Source-Bibliothek, die für Aufgaben im maschinellen Lernen entworfen wurde. Sie unterstützt den Aufbau von neuronalen Netzwerken, Reinforcement Learning und anderen KI-Algorithmen. Mit ihren leistungsstarken und einfach zu verwendenden Algorithmen bietet PyBrain ein wertvolles Werkzeug für Entwickler und Forscher, die verschiedene Probleme des maschinellen Lernens angehen möchten. Die Bibliothek lässt sich nahtlos in andere Python-Bibliotheken integrieren und ist für Aufgaben geeignet, die von einfachem überwachten Lernen bis hin zu komplexen Reinforcement-Learning-Szenarien reichen.
Ausgewählt