IMMA (Agente de Memória Multimodal Interativa) é uma estrutura modular projetada para aprimorar a IA de conversação com memória persistente. Ela codifica texto, imagem e outros dados de interações passadas em um armazenamento de memória eficiente, realiza recuperação semântica para fornecer contexto relevante durante novos diálogos, e aplica técnicas de resumo e filtragem para manter a coerência. As APIs do IMMA permitem que desenvolvedores definam políticas de inserção e recuperação de memória personalizadas, integrando embeddings multimodais e ajustando o agente para tarefas específicas de domínio. Ao gerenciar o contexto do usuário a longo prazo, o IMMA suporta casos de uso que exigem continuidade, personalização e raciocínio em múltiplas etapas ao longo de sessões estendidas.