Un marco de trabajo en PyTorch que permite a los agentes aprender protocolos de comunicación emergentes en tareas de aprendizaje por refuerzo multiagente.
Este repositorio implementa comunicación emergente en aprendizaje por refuerzo multiagente usando PyTorch. Los usuarios pueden configurar redes neuronales para emisores y receptores para jugar a juegos referenciales o navegación cooperativa, fomentando que los agentes desarrollen un canal de comunicación discreto o continuo. Incluye scripts para entrenamiento, evaluación y visualización de protocolos aprendidos, además de utilidades para crear entornos, codificar y decodificar mensajes. Los investigadores pueden extenderlo con tareas personalizadas, modificar arquitecturas de red y analizar la eficiencia del protocolo, promoviendo experimentos rápidos en comunicación emergente de agentes.
Características principales de Learning-to-Communicate-PyTorch
Implementación del juego de comunicación referencial
Soporte para tareas de navegación cooperativa
Arquitecturas modulares de redes en PyTorch
Canales de mensajes discretos y continuos
Scripts para entrenamiento, evaluación y visualización
Un plugin de memoria de ChatGPT de código abierto que almacena y recupera el contexto de la conversación mediante incrustaciones vectoriales para memoria conversacional persistente.
ThinkThread permite a los desarrolladores agregar memoria persistente a aplicaciones impulsadas por ChatGPT. Codifica cada intercambio usando Sentence Transformers y almacena las incrustaciones en tiendas vectoriales populares. En cada nueva entrada del usuario, ThinkThread realiza una búsqueda semántica para recuperar los mensajes pasados más relevantes y los inserta como contexto en la solicitud. Este proceso asegura continuidad, reduce el esfuerzo de ingeniería de prompts y permite que los bots recuerden detalles a largo plazo como preferencias del usuario, historial de transacciones o información específica del proyecto.