Un layer di memoria gestita che dota gli agenti di una memoria a breve termine intelligente e di un contesto persistente tra le conversazioni.
Ottieni una memoria di lavoro limitata alla sessione memorizzando i messaggi in tempo reale di ogni conversazione.
Policy di estrazione configurabili basate su LLM che estraggono fatti specifici, preferenze ed eventi episodici dalle conversazioni, per poi convertirli in embedding vettoriali e memorizzarli in Redis.
Riassumi e sfoltisci automaticamente la cronologia delle sessioni, sposta i fatti ad alto segnale dalla memoria a breve termine a quella a lungo termine e usa il retrieval semantico + metadati per mostrare agli agenti sempre il contesto più rilevante, senza logiche personalizzate di sfoltimento o promozione.
La Developer Survey 2025 di Stack Overflow mostra che sempre più dev di agenti AI si affidano a noi per la memoria e lo storage dei dati. Questo perché siamo veloci, flessibili e affidabili per qualsiasi soluzione: dai copilot AI e chatbot fino agli assistenti interni e ai workflow agentici.
Estrazione automatica
Estrai i fatti importanti da ogni conversazione dell'agente.
Risoluzione del contesto
Risolvi pronomi e riferimenti (es. "lui" → "John").
Deduplicazione
Previeni memorie duplicate grazie all'hashing del contenuto.
Interfacce multiple
API REST, MCP server, client Python.
Autenticazione
OAuth2/JWT, basata su token o disabilitata per lo sviluppo.
Storage scalabile
Usa Redis (predefinito), Pinecone, Chroma, PostgreSQL e altri ancora.