Orientações gerais sobre como realizar experimentos A/B

Nesta página, descrevemos como usar experimentos A/B para entender como a Vertex AI para Pesquisa de Comércio está afetando seus negócios.

Visão geral

Um experimento A/B é um experimento aleatório com dois grupos: um grupo experimental e um grupo de controle. O grupo experimental recebe um tratamento diferente (nesse caso, previsões ou resultados da pesquisa da Vertex AI Search para e-commerce); o grupo de controle não.

Ao executar um experimento A/B, você inclui as informações sobre em qual grupo um usuário estava quando registrava eventos do usuário. Essas informações são usadas para refinar o modelo e fornecer métricas.

Ambas as versões do aplicativo precisam ser as mesmas, exceto que os usuários no grupo experimental veem resultados gerados pela Pesquisa da Vertex AI para comércio e o grupo de controle não. Você registra eventos de usuário em ambos os grupos.

Para mais informações sobre a divisão de tráfego, consulte Como dividir o tráfego na documentação do App Engine.

Plataformas experimentais

Configure o experimento usando uma plataforma de experimento de terceiros, como VWO ou AB Tasty. Os grupos experimental e de controle recebem um ID de experimento exclusivo da plataforma. Ao registrar um evento de usuário, especifique o grupo em que o usuário está, incluindo o código do experimento no campo experimentIds. Fornecer o ID do experimento permite comparar as métricas das versões do seu aplicativo vistas pelos grupos de controle e experimental.

Práticas recomendadas para experimentos A/B

O objetivo de um experimento A/B é determinar com precisão o impacto da atualização do seu site (neste caso, a implantação da Vertex AI para Pesquisa no comércio). Para ter uma medida precisa do impacto, é necessário projetar e implementar o experimento corretamente para que outras diferenças não se influenciem e afetem os resultados.

Para criar um experimento A/B significativo, use as seguintes dicas:

  • Antes de configurar seu experimento A/B, use a previsão ou a visualização de pesquisa para garantir que o modelo esteja se comportando conforme o esperado.

  • Verifique se o comportamento do seu site é idêntico ao do grupo experimental e do grupo de controle.

    O comportamento do site inclui latência, formato de exibição, formato de texto, layout da página, qualidade da imagem e tamanho da imagem. Não pode haver diferenças visíveis para nenhum desses atributos entre a experiência dos grupos de controle e experimental.

  • Aceitar e mostrar os resultados da maneira como são retornados da Pesquisa da Vertex AI para e-commerce e exibi-los na mesma ordem em que são retornados.

    Filtrar itens que estão esgotados é aceitável. No entanto, evite filtros ou organize os resultados com base nas suas regras de negócios.

  • Se você estiver usando eventos de usuário de pesquisa e incluir o token de atribuição obrigatório com eles, verifique se eles estão configurados corretamente. Consulte a documentação sobre tokens de atribuição.

  • Certifique-se de que a configuração de exibição fornecida quando você solicita recomendações ou resultados da pesquisa corresponda à sua intenção para essa recomendação ou resultado da pesquisa e o local em que você exibe os resultados.

    Quando você usa recomendações, a configuração de exibição afeta a forma como os modelos são treinados e quais produtos são recomendados. Saiba mais.

  • Se você estiver comparando uma solução atual com a Vertex AI para Pesquisa para e-commerce, mantenha a experiência do grupo de controle separada estritamente da experiência do grupo experimental.

    Se a solução de controle não fornecer uma recomendação ou um resultado da pesquisa, não forneça um da Vertex AI Search para e-commerce nas páginas de controle. Se você fizer isso, os resultados do teste serão distorcidos.

    Verifique se os usuários não estão alternando entre o grupo de controle e o grupo experimental. Isso é especialmente importante na mesma sessão, mas também recomendado em várias sessões. Isso melhora a performance do experimento e ajuda você a receber resultados de teste A/B com significância estatística mais rápido.