llama-cpp-agent é uma estrutura de código aberto em C++ para executar agentes de IA totalmente offline. Aproveita o motor de inferência llama.cpp para fornecer interações rápidas e de baixa latência e suporta um sistema modular de plugins, memória configurável e execução de tarefas. Desenvolvedores podem integrar ferramentas personalizadas, alternar entre diferentes modelos LLM locais e construir assistentes conversacionais focados em privacidade sem dependências externas.