Steel ist ein entwicklerzentriertes Framework, das die Erstellung und den Betrieb von LLM-gesteuerten Agenten in Produktionsumgebungen beschleunigt. Es bietet plattformunabhängige Konnektoren für große Modell-APIs, einen In-Memory- und persistenten Speicher, integrierte Tool-Aufrufmuster, automatische Antwort-Caches und detailliertes Tracing für Beobachtbarkeit. Entwickler können komplexe Agenten-Workflows definieren, benutzerdefinierte Tools (z.B. Suche, Datenbankabfragen und externe APIs) integrieren und Streaming-Ausgaben verwalten. Steel abstrahiert die Komplexität der Orchestrierung, sodass Teams sich auf die Geschäftslogik konzentrieren und schnell KI-gesteuerte Anwendungen iterieren können.
AppAgent ist ein multimodales Agenten-Framework auf Basis von LLM, das entwickelt wurde, um Smartphone-Apps ohne manuelles Scripting zu steuern. Es integriert Bildschirmaufnahme, GUI-Elementerkennung, OCR-Parsing und natürliche Sprachplanung, um App-Layouts und Benutzerabsichten zu verstehen. Das Framework steuert Touch-Events (Tippen, Wischen, Texteingabe) über ein Android-Gerät oder Emulator, um Arbeitsabläufe zu automatisieren. Forscher und Entwickler können Eingabeaufforderungen anpassen, LLM-APIs konfigurieren und Module erweitern, um neue Apps und Aufgaben zu unterstützen, und so eine adaptive und skalierbare mobile Automatisierung erreichen.