La Memory Bank de Vertex AI Agent Engine vous permet de générer dynamiquement des souvenirs à long terme en fonction des conversations des utilisateurs avec votre agent. Les souvenirs à long terme sont des informations personnalisées auxquelles un utilisateur peut accéder lors de plusieurs sessions. L'agent peut utiliser les infos mémorisées pour personnaliser les réponses à l'utilisateur et assurer la continuité entre les sessions.
Voici quelques fonctionnalités de la Banque de souvenirs :
Stockage persistant des souvenirs, accessibles depuis plusieurs environnements. Vous pouvez utiliser les sessions et la Memory Bank de Vertex AI Agent Engine avec votre agent déployé sur Vertex AI Agent Engine, depuis votre environnement local ou avec d'autres options de déploiement.
Extraction de souvenirs à partir de sessions basée sur un grand modèle de langage (LLM).
Les souvenirs sont générés à distance de manière asynchrone. L'agent n'a donc pas besoin d'attendre leur génération.
Récupération de souvenirs basés sur la recherche de similarité et limités à un utilisateur.
Si vous utilisez la banque de mémoire Vertex AI Agent Engine avec le kit de développement d'agents, votre agent lit et écrit automatiquement des souvenirs à long terme pour vous.
Memory Bank s'intègre aux sessions Vertex AI Agent Engine pour générer des souvenirs à partir des sessions stockées en suivant le processus suivant :
(Sessions)
CreateSession
: créez une session au début de chaque conversation. L'historique des conversations utilisé par l'agent est limité à cette session. Une session contient la séquence chronologique des messages et des actions (SessionEvents
) pour une interaction entre un utilisateur et votre agent. Toutes les sessions doivent avoir un ID utilisateur. Les souvenirs extraits (voirGenerateMemories
) pour cette session sont associés à cet utilisateur.(Sessions)
AppendEvent
: lorsque l'utilisateur interagit avec l'agent, les événements (tels que les messages de l'utilisateur, les réponses de l'agent et les actions des outils) sont importés dans les sessions. Les événements conservent l'historique des conversations et créent un enregistrement de la conversation qui peut être utilisé pour générer des souvenirs.(Sessions)
ListEvents
: lorsque l'utilisateur interagit avec l'agent, celui-ci récupère l'historique des conversations.(Memory Bank) Générer ou créer des souvenirs :
GenerateMemories
: à un intervalle spécifié (par exemple, à la fin de chaque session ou de chaque tour), l'agent peut déclencher la génération de souvenirs à partir de l'historique des conversations. Les informations sur l'utilisateur sont automatiquement extraites de l'historique des conversations afin d'être disponibles pour les sessions actuelles ou futures.CreateMemory
: Votre agent peut écrire des souvenirs directement dans la Memory Bank. Par exemple, l'agent peut décider quand une mémoire doit être écrite et quelles informations doivent être enregistrées (mémoire en tant qu'outil). UtilisezCreateMemory
lorsque vous souhaitez que votre agent ait plus de contrôle sur les faits extraits.
(Memory Bank)
RetrieveMemories
: lorsque l'utilisateur interagit avec votre agent, celui-ci peut récupérer les souvenirs enregistrés à son sujet. Vous pouvez récupérer tous les souvenirs (récupération simple) ou uniquement ceux qui sont les plus pertinents pour la conversation en cours (récupération par recherche de similarité). Vous pouvez ensuite insérer les souvenirs récupérés dans votre requête.
Guides de démarrage rapide
Pour commencer à utiliser Memory Bank, consultez les guides de démarrage rapide suivants :
Guide de démarrage rapide avec l'API REST : suivez le guide de démarrage rapide de l'API REST pour effectuer des appels d'API directement vers les sessions et la banque de mémoire Vertex AI Agent Engine.
Guide de démarrage rapide avec l'Agent Development Kit (ADK) : suivez le guide de démarrage rapide de l'ADK si vous souhaitez que votre agent ADK orchestre les appels à Vertex AI Agent Engine Sessions et Memory Bank pour vous.
Points à noter concernant la sécurité
En plus des responsabilités en termes de sécurité décrites dans Responsabilité partagée de Vertex AI, tenez compte du risque d'injection d'invite et d'empoisonnement de la mémoire qui peuvent affecter votre agent lorsque vous utilisez des mémoires à long terme. L'empoisonnement de la mémoire se produit lorsque de fausses informations sont stockées dans la banque de mémoire. L'agent peut ensuite agir sur ces informations fausses ou malveillantes lors de futures sessions.
Pour limiter le risque d'empoisonnement de la mémoire, vous pouvez procéder comme suit :
Model Armor : utilisez Model Armor pour inspecter les requêtes envoyées à la banque de mémoire ou depuis votre agent.
Tests antagonistes : testez de manière proactive votre application LLM pour détecter les failles d'injection de requêtes en simulant des attaques. C'est ce que l'on appelle généralement le "red teaming".
Exécution en bac à sable : si l'agent est capable d'exécuter des actions ou d'interagir avec des systèmes externes ou critiques, ces actions doivent être effectuées dans un environnement de bac à sable avec contrôle des accès strict et un examen humain.
Pour en savoir plus, consultez L'approche de Google pour des agents d'IA sécurisés.