Allgemeine Anleitung zum Durchführen von A/B-Tests

Auf dieser Seite wird beschrieben, wie Sie A/B-Tests verwenden, um zu verstehen, wie sich Vertex AI Search für den Einzelhandel auf Ihr Unternehmen auswirkt.

Übersicht

Ein A/B-Test ist ein zufälliger Test mit zwei Gruppen: einer Testgruppe und einer Kontrollgruppe. Die Testgruppe erhält eine andere Behandlung (in diesem Fall Vorhersagen oder Suchergebnisse aus der Vertex AI Search für den Einzelhandel) als die Kontrollgruppe.

Wenn Sie einen A/B-Test ausführen, geben Sie an, in welcher Gruppe sich ein Nutzer befand, wenn Sie Nutzerereignisse aufzeichnen. Diese Informationen werden verwendet, um das Modell zu verfeinern und Messwerte bereitzustellen.

Beide Versionen Ihrer Anwendung müssen identisch sein, mit der Ausnahme, dass Nutzer in der Testgruppe die von Vertex AI Search for Retail generierten Ergebnisse sehen und die Kontrollgruppe nicht. Nutzerereignisse werden für beide Gruppen protokolliert.

Weitere Informationen zur Trafficaufteilung finden Sie in der App Engine-Dokumentation unter Traffic aufteilen.

Testplattformen

Richten Sie den Test mithilfe einer Testplattform eines Drittanbieters wie VWO, ABTasty oder Optimizely ein. Die Kontroll- und Testgruppen erhalten jeweils eine eindeutige Test-ID von der Plattform. Wenn Sie ein Nutzerereignis aufzeichnen, geben Sie im Feld experimentIds an, in welcher Gruppe sich der Nutzer befindet. Durch Angabe der Test-ID können Sie die Messwerte für die Versionen Ihrer Anwendung vergleichen, die von der Kontroll- bzw. Testgruppe gesehen werden.

Best Practices für A/B-Tests

Das Ziel eines A/B-Tests ist es, die Auswirkungen der Aktualisierung Ihrer Website (in diesem Fall Vertex AI Search für den Einzelhandel) genau zu bestimmen. Damit Sie die Auswirkungen genau ermitteln können, müssen Sie den Test korrekt entwerfen und implementieren, damit sich keine anderen Unterschiede einschleichen und auf die Testergebnisse auswirken.

Beachten Sie die folgenden Tipps, um einen sinnvollen A/B-Test zu erstellen:

  • Bevor Sie Ihren A/B-Test einrichten, sollten Sie mithilfe der Vorhersage- oder Suchvorschau prüfen, ob sich Ihr Modell wie erwartet verhält.

  • Achten Sie darauf, dass das Verhalten Ihrer Website für die Testgruppe und die Kontrollgruppe identisch ist.

    Das Verhalten der Website umfasst Latenz, Anzeigeformat, Textformat, Seitenlayout, Bildqualität und Bildgröße. Zwischen den Attributen der Kontroll- und Testgruppen sollte es keinen erkennbaren Unterschied geben.

  • Akzeptieren und zeigen Sie die Ergebnisse an, die von Vertex AI Search for Retail zurückgegeben werden, und zeigen Sie sie in derselben Reihenfolge an, in der sie zurückgegeben werden.

    Das Herausfiltern von Artikeln, die nicht auf Lager sind, ist akzeptabel. Sie sollten jedoch vermeiden, dass Ergebnisse basierend auf Ihren Geschäftsregeln gefiltert oder sortiert werden.

  • Wenn Sie ein Attributionstoken in Ihre Nutzerereignisse aufnehmen, muss es richtig eingerichtet sein. Weitere Informationen finden Sie in der Dokumentation zu Attributionstokens.

  • Achten Sie darauf, dass die Bereitstellungskonfiguration, die Sie beim Anfordern von Empfehlungen oder Suchergebnissen angeben, mit Ihrer Absicht für diese Empfehlung oder dieses Suchergebnis übereinstimmt und mit der Position, an der Sie die Ergebnisse anzeigen.

    Wenn Sie Empfehlungen verwenden, wirkt sich die Bereitstellungskonfiguration darauf aus, wie Modelle trainiert werden und welche Produkte empfohlen werden. Weitere Informationen

  • Wenn Sie eine vorhandene Lösung mit Vertex AI Search for Retail vergleichen, sollten Sie die Erfahrung der Kontrollgruppe strikt von der Erfahrung der Testgruppe trennen.

    Wenn die Kontrolllösung keine Empfehlung bzw. Suchergebnis bereitstellt, geben Sie keines über Vertex AI Search for Retail auf den Kontrollseiten an. Dies verzerrt sonst Ihre Testergebnisse.

    Achten Sie darauf, dass Ihre Nutzer nicht zwischen der Kontrollgruppe und der Testgruppe wechseln. Das ist besonders wichtig innerhalb derselben Sitzung, wird aber auch für mehrere Sitzungen empfohlen. So lässt sich die Testleistung verbessern und Sie erhalten schneller statistisch signifikante A/B-Testergebnisse.