Diese Seite wurde von der Cloud Translation API übersetzt.

SemanticCachePopulate-Richtlinie

Diese Seite gilt für Apigee, aber nicht für Apigee Hybrid.

Apigee Edge-Dokumentation aufrufen

Übersicht

Die SemanticCachePopulate-Richtlinie ist eine erweiterte Caching-Richtlinie, die die Leistung von KI-Arbeitslasten optimieren soll, insbesondere von Arbeitslasten mit Large Language Models (LLMs).

In der Richtlinie wird die Vertex AI Text Embeddings API verwendet, um Einbettungen für Text zu generieren, und Vector Search, um API-Antworten basierend auf semantischer Ähnlichkeit und nicht auf exakten Übereinstimmungen im Cache zu speichern.

Die Richtlinie „SemanticCachePopulate“ kann die Antwortzeiten für wiederholte Anfragen verkürzen und die Kosten optimieren, indem das Anrufvolumen an LLMs reduziert wird.

Diese Richtlinie funktioniert in Verbindung mit der SemanticCacheLookup-Richtlinie.

Diese Richtlinie ist eine erweiterbare Richtlinie, deren Verwendung je nach Apigee-Lizenz Auswirkungen auf die Kosten oder die Nutzung haben kann. Informationen zu Richtlinientypen und Auswirkungen auf die Nutzung finden Sie unter Richtlinientypen.

Hinweise

Bevor Sie die SemanticCachePopulate-Richtlinie verwenden, führen Sie die folgenden Aufgaben aus:

Erstellen Sie ein Vertex AI-Projekt.
Erstellen Sie einen Vektorsuchindex.
Erstellen Sie einen Vertex AI-Endpunkt für den Index.
Erstellen Sie eine SemanticCachePopulate-Richtlinie.

Weitere Informationen zum Ausführen dieser Aufgaben finden Sie unter Erste Schritte mit Richtlinien für semantisches Caching.

Rollen und Berechtigungen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle AI Platform User (roles/aiplatform.user) für das Dienstkonto zuzuweisen, das Sie zum Bereitstellen von Apigee-Proxys verwenden, um die Berechtigungen zu erhalten, die Sie zum Anwenden und Verwenden der SemanticCachePopulate-Richtlinie benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

APIs aktivieren

Enable the Compute Engine, Vertex AI, and Cloud Storage APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Element `<SemanticCachePopulate>`

Definiert eine SemanticCachePopulate-Richtlinie.

Standardwert	Siehe Standardrichtlinie Tab unten
Erforderlich?	Erforderlich
Typ	Komplexes Objekt
Übergeordnetes Element	–
Untergeordnete Elemente	`<DisplayName>` `<IgnoreUnresolvedVariables>` `<SimilaritySearch>` `<TTLInSeconds>`

Das <SemanticCachePopulate>-Element verwendet die folgende Syntax:

Syntax

Das <SemanticCachePopulate>-Element verwendet die folgende Syntax:

<SemanticCachePopulate async="false" continueOnError="false"enabled="true" name="SCP-populate">
  <DisplayName>SCP-populate</DisplayName>
  <IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
  <SimilaritySearch>
    <VertexAI>
      <URL>https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/indexes/{INDEX_ID}:upsertDatapoints</URL>
    </VertexAI>
  </SimilaritySearch>
  <TTLInSeconds>{EXPIRATION_TIME_IN_SECONDS}</TTLInSeconds>
</SemanticCachePopulate>

Standardrichtlinie

Das folgende Beispiel zeigt die Standardeinstellungen, wenn Sie Ihrem API-Proxy in der Apigee-UI eine SemanticCachePopulate-Richtlinie hinzufügen:

<SemanticCachePopulate async="false" continueOnError="false"enabled="true" name="SCP-populate">
  <DisplayName>SCP-populate</DisplayName>
  <IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
  <SimilaritySearch>
    <VertexAI>
      <URL>https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/indexes/{INDEX_ID}:upsertDatapoints</URL>
    </VertexAI>
  </SimilaritySearch>
  <TTLInSeconds>60</TTLInSeconds>
</SemanticCachePopulate>

Wenn Sie eine neue SemanticCachePopulate-Richtlinie in die Apigee-UI einfügen, enthält die Vorlage Stubs für alle möglichen Vorgänge. Informationen zu den erforderlichen Elementen finden Sie unten.

Dieses Element hat folgende Attribute, die allen Richtlinien gemeinsam sind:

Attribut	Standard	Erforderlich?	Beschreibung
`name`	-	Erforderlich	Der interne Name der Richtlinie. Der Wert des Attributs `name` kann Buchstaben, Ziffern, Leerzeichen, Bindestriche, Unterstriche und Punkte enthalten. Dieser Wert darf 255 Zeichen nicht überschreiten. Optional können Sie das Element `<DisplayName>` verwenden, um die Richtlinie im Proxy-Editor der Verwaltungs-UI mit einem anderen Namen in einer natürlichen Sprache zu versehen.
`continueOnError`	false	Optional	Legen Sie `false` fest, um einen Fehler zurückzugeben, wenn eine Richtlinie fehlschlägt. Dies ist für die meisten Richtlinien das erwartete Verhalten. Legen Sie `true` fest, damit die Ablaufausführung auch nach dem Fehlschlagen einer Richtlinie fortgesetzt wird. Weitere Informationen: Fehlerregeln werden NUR im Fehlerzustand ausgelöst (über continueOnError) Umgang mit Fehlern im aktuellen Ablauf
`enabled`	wahr	Optional	Setzen Sie den Wert auf `true`, um die Richtlinie zu erzwingen. Legen Sie `false` fest, um die Richtlinie zu deaktivieren. Die Richtlinie wird nicht durchgesetzt, selbst wenn sie mit einem Ablauf verknüpft ist.
`async`	false	Verworfen	Dieses Attribut wurde verworfen.

Die folgende Tabelle enthält eine allgemeine Beschreibung der untergeordneten Elemente von <SemanticCachePopulate>:

Untergeordnetes Element	Erforderlich?	Beschreibung
`<DisplayName>`	Optional	Der Name der Richtlinie.
`<IgnoreUnresolvedVariables>`	Optional	Bestimmt, ob die Verarbeitung beendet wird, wenn ein Property-Set nicht aufgelöst werden kann.
`<SimilaritySearch>`	Erforderlich	Element mit den Informationen, die zum Aktualisieren des Vektorindex erforderlich sind. Weitere Informationen finden Sie unter Datenpunkte einfügen oder aktualisieren. Die Ablaufzeit für Datenpunkte beträgt <TTLInSeconds> ab dem Zeitpunkt des Eintrags.
`<TTLInSeconds>`	Optional	Die Gültigkeitsdauer (TTL) für die im Cache gespeicherten Antworten in Sekunden. Der Standardwert ist `60`.

Beispiel

In diesem Abschnitt finden Sie ein Beispiel für die Verwendung von <SemanticCachePopulate>.

<SemanticCachePopulate async="false" continueOnError="false"enabled="true" name="SCP-populate">
  <DisplayName>SCP-populate</DisplayName>
  <IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
  <SimilaritySearch>
    <VertexAI>
      <URL>https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/indexes/{INDEX_ID}:upsertDatapoints</URL>
    </VertexAI>
  </SimilaritySearch>
  <TTLInSeconds>60</TTLInSeconds>
</SemanticCachePopulate>

Verweis auf untergeordnetes Element

In diesem Abschnitt werden die untergeordneten Elemente von <SemanticCachePopulate> beschrieben.

`<DisplayName>`

Wird zusätzlich zum Attribut name verwendet, um die Richtlinie im Proxy-Editor der Verwaltungs-UI mit einem anderen, natürlicher klingenden Namen zu versehen.

Das Element <DisplayName> ist für alle Richtlinien gleich.

Standardwert	–
Erforderlich?	Optional. Wenn Sie `<DisplayName>` weglassen, wird der Wert des Attributs `name` der Richtlinie verwendet.
Typ	String
Übergeordnetes Element	<`PolicyElement`>
Untergeordnete Elemente	Keine

Das <DisplayName>-Element verwendet die folgende Syntax:

Syntax

<PolicyElement>
  <DisplayName>POLICY_DISPLAY_NAME</DisplayName>
  ...
</PolicyElement>

Beispiel

<PolicyElement>
  <DisplayName>My Validation Policy</DisplayName>
</PolicyElement>

Das <DisplayName>-Element hat keine Attribute oder untergeordneten Elemente.

`<IgnoreUnresolvedVariables>`

Bestimmt, ob die Verarbeitung beendet wird, wenn eine Variable nicht aufgelöst werden kann. Auf true festlegen, um nicht aufgelöste Variablen zu ignorieren und die Verarbeitung fortzusetzen.

IgnoreUnresolvedVariables gilt nicht, wenn <DefaultValue> angegeben ist.

Standardwert	Falsch
Erforderlich?	Optional
Typ	Boolesch
Übergeordnetes Element	`<SemanticCachePopulate>`
Untergeordnete Elemente	Keine

`<SimilaritySearch>`

Element mit den Informationen, die zum Aktualisieren des Vektorindex erforderlich sind.

Weitere Informationen finden Sie unter Datenpunkte einfügen oder aktualisieren.

Die Ablaufzeit für Datenpunkte beträgt <TTLInSeconds> ab dem Zeitpunkt der Eingabe.

Standardwert	–
Erforderlich?	Erforderlich
Typ	String
Übergeordnetes Element	`<SemanticCachePopulate>`
Untergeordnete Elemente	`<VertexAI>`

Das <SimilaritySearch>-Element verwendet die folgende Syntax:

<SimilaritySearch>
  <VertexAI>
    <URL>https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/indexes/{INDEX_ID}:upsertDatapoints</URL>
  </VertexAI>
</SimilaritySearch>

<VertexAI> (untergeordnetes Element von `<SimilaritySearch>`)

Enthält das <URL>-Element für Vertex AI-spezifische Attribute.

Standardwert	–
Erforderlich?	Erforderlich
Typ	String
Übergeordnetes Element	`<SimilaritySearch>`
Untergeordnete Elemente	`<URL>`

Das VertexAI-Element verwendet die folgende Syntax:

<VertexAI>
  <URL>https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/indexes/{INDEX_ID}:upsertDatapoints</URL>
</VertexAI>

<URL> (untergeordnetes Element von `<VertexAI>`)

Die URL, die zum Einfügen von Datenpunkten in den Vektorindex verwendet wird.

Standardwert	–
Erforderlich?	Erforderlich
Typ	String
Übergeordnetes Element	`<VertexAI>`
Untergeordnete Elemente	Keins

Das URL-Element verwendet die folgende Syntax:

<URL>https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/indexes/{INDEX_ID}:upsertDatapoints</URL>

Das URL-Element unterstützt die Verwendung von URL-Vorlagen. Optional können Sie in diesem Element eine Variable angeben, die den Wert der URL enthält, wie im folgenden Beispiel gezeigt:

<URL>https://{URL_VARIABLE}</URL>

`<TTLInSeconds>`

Element, das die Gültigkeitsdauer (TTL) für die im Cache gespeicherten Antworten in Sekunden angibt. Der Standardwert ist 60.

Weitere Informationen finden Sie unter Aktiven Index aktualisieren und neu erstellen.

Standardwert	–
Erforderlich?	Optional
Typ	String
Übergeordnetes Element	`<SemanticCachePopulate>`
Untergeordnete Elemente	Keins

Ablaufvariablen

Ablaufvariablen konfigurieren das dynamische Laufzeitverhalten für Richtlinien und Abläufe auf der Grundlage von HTTP-Headern oder Nachrichteninhalten oder dem Kontext, der im Ablauf verfügbar ist. Weitere Informationen zu Ablaufvariablen finden Sie in der Referenz zu Ablaufvariablen.

Diese Richtlinie stellt während der Ausführung die folgenden schreibgeschützten Ablaufvariablen bereit. Sie können diese Ablaufvariablen mit der DataCapture-Richtlinie verwenden, um benutzerdefinierte Analyseberichte zu erstellen. Weitere Informationen finden Sie unter Kundendaten mit der Data Capture-Richtlinie erfassen.

Variablenname	Beschreibung
`response.content`	Enthält den gesamten Inhalt der API-Antwort.
`semanticcache.populate.policy_name.upsert_index_request`	Enthält die Anfrage-Payload, die an die Vertex AI Vector Search API gesendet wird, um den Vektorindex mit neuen Einbettungen und Metadaten zu aktualisieren.
`semanticcache.populate.policy_name.upsert_index_response`	Enthält die Antwort der Vertex AI Vector Search API, die den Erfolg oder Misserfolg des Indexaktualisierungsvorgangs angibt.

Fehlerreferenz

In diesem Abschnitt werden die Fehlercodes und Fehlermeldungen beschrieben, die von Apigee zurückgegeben werden, sowie die Fehlervariablen, die von Apigee für die <SemanticCachePopulate>-Richtlinie festgelegt werden. Diese Informationen sind wichtig, wenn Sie Fehlerregeln zur Verarbeitung von Fehlern entwickeln. Weitere Informationen finden Sie unter Was Sie über Richtlinienfehler wissen müssen und Fehler beheben.

Laufzeitfehler

Diese Fehler können bei Ausführung der Richtlinie auftreten.

Fehlercode	HTTP-Status	Ursache
`steps.semanticcachepopulate.VectorSearchUpsertServiceUnavailable`	`400`	Dieser Fehler tritt auf, wenn die Vector Search Upsert Datapoints API nicht verfügbar ist.
`steps.semanticcache.populate.VectorSearchUpsertAPIFailed`	`500`	Dieser Fehler tritt auf, wenn der Dienst für die Vector Search Upsert Datapoints API fehlschlägt.
`steps.semanticcache.populate.AuthenticationFailure`	`500`	Dieser Fehler tritt auf, wenn das Dienstkonto nicht die erforderlichen Berechtigungen hat.
`steps.semanticcache.populate.CalloutError`	`500`	Der Vertex AI-Dienstanruf ist fehlgeschlagen.
`steps.semanticcache.populate.InternalError`	`500`	Dieser Fehler tritt auf, wenn in der `<SemanticCachePopulate>`-Richtlinie ein unerwarteter Fehler auftritt.

Bereitstellungsfehler

Diese Fehler können auftreten, wenn Sie einen Proxy mit dieser Richtlinie bereitstellen.

Fehlername	Ursache
`The SimilaritySearch URL {url} is invalid.`	Tritt auf, wenn das Element <URL> in <SimilaritySearch> leer oder ungültig ist.
`The scheme {http-scheme} of SimilaritySearch URL {url} must be one of http, https.`	Tritt auf, wenn das `http`-Schema des SimilaritySearch-Elements <URL> ungültig ist.
`The TTLInSeconds element must be >= 0.`	Wenn der Wert auf null oder eine negative Zahl gesetzt ist, schlägt die Bereitstellung des API-Proxys fehl.

Fehlervariablen

Diese Variablen werden festgelegt, wenn diese Richtlinie zur Laufzeit einen Fehler auslöst. Weitere Informationen finden Sie unter Was Sie über Richtlinienfehler wissen müssen.

Variablen	Wo	Beispiel
`fault.name="FAULT_NAME"`	`FAULT_NAME` ist der Name des Fehlers, der in der obigen Tabelle Laufzeitfehler aufgeführt ist. Der Fehlername ist der letzte Teil des Fehlercodes.	`fault.name Matches "UnresolvedVariable"`
`semanticcachepopulate.POLICY_NAME.failed`	`POLICY_NAME` ist der benutzerdefinierte Name der Richtlinie, die den Fehler ausgelöst hat.	`semanticcachepopulate.SC-populate.failed = true`

Beispiel für eine Fehlerantwort

Hinweis:Bei der Fehlerbehandlung besteht die Best Practice darin, den Teil errorcode der Fehlerantwort zu beachten. Verlassen Sie sich nicht auf den Text in faultstring. Er kann sich ändern.

{
"fault": {
  "faultstring": "SemanticCacheLookup[SC-populate]: unable to resolve variable [variable_name]",
  "detail": {
    "errorcode": "steps.semanticcachepopulate.UnresolvedVariable"
  }
}
}

Beispiel für eine Fehlerregel

<FaultRule name="SemanticCacheLookup Faults">
  <Step>
      <Name>SCL-CustomSetVariableErrorResponse</Name>
      <Condition>(fault.name = "SetVariableFailed")</Condition>
  </Step>
  <Condition>(semanticcachelookup.failed = true)</Condition>
</FaultRule>

Schemas

Jeder Richtlinientyp wird durch ein XML-Schema (.xsd) definiert. Zu Referenzzwecken sind Richtlinienschemas auf GitHub verfügbar.

SemanticCachePopulate-Richtlinie Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Übersicht

Hinweise

Rollen und Berechtigungen

APIs aktivieren

Element <SemanticCachePopulate>

Syntax

Standardrichtlinie

Beispiel

Verweis auf untergeordnetes Element

<DisplayName>

Syntax

Beispiel

<IgnoreUnresolvedVariables>

<SimilaritySearch>

<VertexAI> (untergeordnetes Element von <SimilaritySearch>)

<URL> (untergeordnetes Element von <VertexAI>)

<TTLInSeconds>

Ablaufvariablen

Fehlerreferenz

Laufzeitfehler

Bereitstellungsfehler

Fehlervariablen

Beispiel für eine Fehlerantwort

Beispiel für eine Fehlerregel

Schemas

SemanticCachePopulate-Richtlinie

Element `<SemanticCachePopulate>`

`<DisplayName>`

`<IgnoreUnresolvedVariables>`

`<SimilaritySearch>`

<VertexAI> (untergeordnetes Element von `<SimilaritySearch>`)

<URL> (untergeordnetes Element von `<VertexAI>`)

`<TTLInSeconds>`