IMMA est un agent IA amélioré par mémoire qui permet la récupération de contexte multimodal à long terme pour une assistance conversationnelle personnalisée.
IMMA (Interactive Multi-Modal Memory Agent) est un cadre modulaire conçu pour améliorer l’IA conversationnelle avec une mémoire persistante. Il encode le texte, les images et d’autres données des interactions passées dans un stockage mémoire efficace, effectue une récupération sémantique pour fournir un contexte pertinent lors de nouveaux dialogues, et applique des techniques de résumé et de filtrage pour maintenir la cohérence. Les API de IMMA permettent aux développeurs de définir des politiques d’insertion et de récupération de mémoire personnalisées, d’intégrer des embeddings multimodaux et de peaufiner l’agent pour des tâches spécifiques au domaine. En gérant le contexte utilisateur à long terme, IMMA supporte des cas d’usage nécessitant continuité, personnalisation et raisonnement multi-tours sur des sessions prolongées.
Fonctionnalités principales de IMMA
Codage mémoire multimodal à long terme
Récupération sémantique de mémoire
Résumé et filtrage de mémoire
Dialogues multi-tours sensibles au contexte
Politiques de mémoire et stockage personnalisables
Avantages et inconvénients de IMMA
Inconvénients
Avantages
Modélise simultanément plusieurs types d'interactions indépendantes via des graphes latents multiplex.
Utilise des mécanismes d'attention pour pondérer la force des relations, améliorant l'expressivité du modèle.
L'entraînement progressif par couches améliore l'apprentissage des interactions en couches et la précision des prévisions.
Meilleure prédiction de trajectoire à long terme par rapport aux méthodes précédentes.
Interprétabilité améliorée des interactions sociales multi-agents.