IMMA é um agente AI com memória aumentada que possibilita a recuperação de contexto multimodal de longo prazo para assistência conversacional personalizada.
IMMA (Agente de Memória Multimodal Interativa) é uma estrutura modular projetada para aprimorar a IA de conversação com memória persistente. Ela codifica texto, imagem e outros dados de interações passadas em um armazenamento de memória eficiente, realiza recuperação semântica para fornecer contexto relevante durante novos diálogos, e aplica técnicas de resumo e filtragem para manter a coerência. As APIs do IMMA permitem que desenvolvedores definam políticas de inserção e recuperação de memória personalizadas, integrando embeddings multimodais e ajustando o agente para tarefas específicas de domínio. Ao gerenciar o contexto do usuário a longo prazo, o IMMA suporta casos de uso que exigem continuidade, personalização e raciocínio em múltiplas etapas ao longo de sessões estendidas.
Recursos Principais do IMMA
Codificação de memória multimodal de longo prazo
Recuperação semântica de memória
Resumo e filtragem de memória
Diálogos multi-turno sensíveis ao contexto
Políticas de memória e armazenamento personalizáveis
Prós e Contras do IMMA
Contras
Prós
Modela simultaneamente vários tipos independentes de interação por meio de gráficos latentes multiplex.
Utiliza mecanismos de atenção para ponderar a força das relações, aprimorando a expressividade do modelo.
O Treinamento Progressivo em Camadas melhora o aprendizado das interações em camadas e a precisão da previsão.
Melhor previsão de trajetória a longo prazo em comparação com métodos anteriores.
Interpretabilidade aprimorada das interações sociais multiagentes.
Um plugin de memória de código aberto para ChatGPT que armazena e recupera o contexto do chat usando incorporações vetoriais para memória conversacional persistente.
ThinkThread permite que desenvolvedores adicionem memória persistente a aplicações baseadas em ChatGPT. Ele codifica cada troca usando Sentence Transformers e armazena as embeddições em bancos de dados vetoriais populares. Para cada nova entrada do usuário, o ThinkThread realiza uma busca semântica para recuperar as mensagens passadas mais relevantes e as injeta como contexto na solicitação. Este processo garante continuidade, reduz o esforço de engenharia de prompts e permite que bots memorizem detalhes de longo prazo, como preferências do usuário, histórico de transações ou informações específicas do projeto.