MCP-Ollama-Client fournit une interface unifiée pour communiquer avec les modèles linguistiques d’Ollama exécutés localement. Il supporte des dialogues duplex complets avec un suivi automatique de l’historique, un streaming en direct des tokens de complétion et des modèles de prompt dynamiques. Les développeurs peuvent choisir parmi les modèles installés, personnaliser des hyperparamètres tels que la température et le nombre maximum de tokens, et surveiller les métriques d’utilisation directement dans le terminal. Le client expose une enveloppe API simple de type REST pour l’intégration dans des scripts d’automatisation ou des applications locales. Avec un rapport d’erreur intégré et une gestion de configuration, il facilite le développement et le test des workflows alimentés par LLM sans dépendre d’API externes.
echoOLlama exploite l'écosystème Ollama pour fournir un cadre d'agent minimal : il lit l'entrée utilisateur du terminal, l'envoie à un LLM local configuré, et diffuse les réponses en temps réel. Les utilisateurs peuvent script des séquences d'interactions, enchaîner des prompts, et expérimenter l'ingénierie des prompts sans modifier le code modèle sous-jacent. Cela rend echoOLlama idéal pour tester des schémas de conversation, construire des outils simples en ligne de commande, et gérer des tâches itératives tout en préservant la confidentialité des données.