llama-cpp-agent est un framework open-source en C++ pour faire fonctionner entièrement hors ligne des agents IA. Il exploite le moteur d'inférence llama.cpp pour fournir des interactions rapides et à faible latence, et supporte un système modulaire de plugins, une mémoire configurable et l'exécution de tâches. Les développeurs peuvent intégrer des outils personnalisés, passer d'un modèle LLM local à un autre et créer des assistants conversationnels axés sur la confidentialité sans dépendances externes.