Una capa de memoria gestionada que proporciona a los agentes memoria inteligente a corto plazo y contexto persistente entre conversaciones.
Obtén memoria de trabajo asociada a cada sesión almacenando los mensajes activos de cada conversación.
Las políticas de extracción configurables basadas en LLM identifican hechos, preferencias y eventos relevantes dentro de las conversaciones, los convierten en vectores y los almacenan en Redis.
Resume y depura automáticamente el historial de las sesiones, promueve los datos más relevantes de la memoria a corto plazo a la memoria a largo plazo y utiliza recuperación semántica y por metadatos para que los agentes siempre dispongan del contexto más relevante, sin necesidad de implementar lógica personalizada de promoción o depuración.
La encuesta Stack Overflow Developer Survey 2025 reveló que más devs de agentes de IA confían en nosotros para la memoria y el almacenamiento de datos. Y esto es así porque somos rápidos, flexibles y fiables para todo tipo de casos de uso, desde copilotos de IA y chatbots hasta asistentes internos y flujos de trabajo basados en agentes.
Extracción automática
Extrae información importante de cada conversación del agente.
Contexto enriquecido
Resuelve pronombres y referencias ("él" → "Juan").
Eliminación de duplicados
Evita memorias duplicadas mediante hash de contenido.
Varias interfaces
API REST, servidor MCP y cliente Python.
Autenticación
OAuth2/JWT, basada en tokens o desactivada para entornos de desarrollo.
Almacenamiento escalable
Utiliza Redis (predeterminado), Pinecone, Chroma, PostgreSQL y mucho más.