Rédiger des requêtes avec l'aide de Gemini

Vous pouvez utiliser Gemini pour Google Cloud, qui propose une assistance basée sur l'IA, pour vous aider à interroger vos données à l'aide de requêtes SQL et de code Python. Gemini dans BigQuery peut générer des requêtes, compléter le code à mesure que vous tapez du texte et expliquer les requêtes.

Sans votre autorisation expresse, Gemini pour Google Cloud n'utilise pas vos requêtes ni ses réponses comme des données destinées à l'entraînement de ses modèles. Pour en savoir plus sur la manière dont Google utilise vos données, consultez la section Utilisation de vos données par Gemini pour Google Cloud. Pour savoir comment accepter le partage de données pour les fonctionnalités Gemini dans BigQuery en version preview, consultez la section Contribuer à améliorer les suggestions.

Gemini dans BigQuery n'accepte que des requêtes en anglais.

Ce document est destiné aux analystes de données, aux data scientists et aux développeurs de données qui travaillent avec des requêtes SQL et des notebooks Colab Enterprise dans BigQuery. Nous partons du principe que vous savez interroger des données dans l'espace de travail SQL BigQuery ou utiliser des notebooks pour analyser des données BigQuery à l'aide de Python.

Avant de commencer

  1. Assurez-vous que Gemini est configuré pour votre projet Google Cloud. Les fonctionnalités Gemini dans BigQuery peuvent être désactivées ou indisponibles jusqu'à la fin de la configuration. Ces étapes sont généralement effectuées par un administrateur.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  4. Dans la barre d'outils, cliquez sur l'icône déroulante pen_sparkGemini.

    Bouton Gemini dans la barre d'outils BigQuery.

  5. Dans la liste déroulante des fonctionnalités, sélectionnez celles que vous souhaitez activer. Les fonctionnalités disponibles sont les suivantes :

    • Gemini dans une requête SQL :
      • Saisie semi-automatique (preview) : au fur et à mesure que vous tapez du texte dans l'éditeur de requête, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle, ou vous aider à effectuer une itération sur une requête.
      • Génération automatique : vous pouvez demander à Gemini dans BigQuery de générer une requête SQL à l'aide d'un commentaire en langage naturel, tapé dans l'éditeur de requête BigQuery.
      • Outil de génération SQL : vous pouvez taper du texte en langage naturel dans un outil pour générer une requête SQL, avec des options permettant d'affiner les résultats de la requête, de choisir les sources de tables et de comparer les résultats.
      • Explication : vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel.
    • Gemini dans un notebook Python :
      • Complétion de code (preview) : Gemini fournit des recommandations contextuelles appropriées basées sur le contenu du notebook.
      • Génération de code : vous pouvez interroger Gemini avec une instruction ou une question en langage naturel, afin de générer du code Python.

Autorisations requises

Pour obtenir les autorisations nécessaires pour écrire des requêtes avec l'assistance Gemini, demandez à votre administrateur de vous accorder le rôle IAM Utilisateur de Gemini pour Google Cloud (roles/cloudaicompanion.user) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Ce rôle prédéfini contient les autorisations requises pour écrire des requêtes avec l'assistance Gemini. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Vous devez disposer des autorisations suivantes pour écrire des requêtes avec l'assistance Gemini :

  • cloudaicompanion.entitlements.get
  • cloudaicompanion.instances.completeTask
  • Pour expliquer les requêtes SQL : cloudaicompanion.companions.generateChat
  • Pour compléter du code SQL ou Python : cloudaicompanion.instances.completeCode
  • Pour générer du code SQL ou Python : cloudaicompanion.instances.generateCode

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Générer une requête SQL

Pour générer une requête SQL basée sur le schéma de vos données, vous pouvez fournir à Gemini une instruction ou une question en langage naturel, également appelée requête. Même si vous débutez sans la moindre portion de code, que vous n'avez que des connaissances limitées sur le schéma de données ou bien seulement des connaissances de base sur la syntaxe GoogleSQL, Gemini peut générer du code SQL qui peut vous aider à explorer vos données.

Utiliser l'outil de génération SQL

L'outil de génération de SQL vous permet d'utiliser le langage naturel pour générer une requête SQL sur les tables que vous avez consultées ou interrogées récemment. Vous pouvez également utiliser l'outil pour modifier une requête existante et spécifier manuellement les tables pour lesquelles vous souhaitez générer du code SQL.

Procédez comme suit pour utiliser l'outil de génération SQL :

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. À côté de l'éditeur de requête, cliquez sur pen_spark Outil de génération SQL.

    Bouton de l'outil de génération SQL dans l'éditeur de requête BigQuery.

  3. À gauche de l'éditeur de requête, cliquez sur l'icône pen_spark Outil de génération SQL pour ouvrir l'outil.

  4. Dans l'outil de génération SQL, posez une question ou saisissez une requête en langage naturel concernant une table que vous avez récemment consultée ou interrogée. Par exemple, vous pouvez afficher la table bigquery-public-data.austin_bikeshare.bikeshare_trips, puis taper le commentaire suivant :

     Show me the duration and subscriber type for the ten longest trips
    
  5. Cliquez sur Générer.

    Gemini génère une requête SQL semblable à celle-ci :

    SELECT
        subscriber_type,
        duration_sec
      FROM
          `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips`
    ORDER BY
        duration_sec DESC
    LIMIT 10;
    
  6. Examinez la requête SQL générée et effectuez l'une des actions suivantes:

    • Pour accepter la requête SQL générée, cliquez sur Insérer pour insérer l'instruction dans l'éditeur de requête. Vous pouvez ensuite cliquer sur Exécuter pour exécuter la requête SQL suggérée.
    • Pour modifier votre requête, cliquez sur Modifier, puis modifiez ou remplacez votre requête initiale. Une fois que vous avez modifié votre requête, cliquez sur Mettre à jour pour afficher la nouvelle requête.
    • Pour mettre à jour les sources de tables utilisées comme contexte pour générer la requête SQL suggérée, cliquez sur Modifier les sources des tables, sélectionnez les sources de tables en cochant les cases correspondantes, puis cliquez sur Appliquer.
    • Pour afficher un résumé en langage naturel de la requête générée, cliquez sur Récapitulatif de la requête.
    • Pour affiner la requête SQL suggérée, tapez des ajustements dans la zone de texte Affiner, puis cliquez sur Envoyer pour affiner votre requête. Par exemple, tapez limit to 1000 pour limiter le nombre de résultats de la requête. Pour comparer les modifications apportées à votre requête, cochez la case Afficher le différentiel.
    • Pour ignorer la suggestion et ne pas insérer la requête générée, fermez l'outil de génération SQL.

Désactiver l'outil de génération SQL

Pour savoir comment désactiver l'outil de génération SQL, consultez la section Désactiver les fonctionnalités Gemini.

Générer du code SQL à partir d'un commentaire

Vous pouvez générer du code SQL dans l'éditeur SQL en décrivant la requête souhaitée dans un commentaire, puis en appuyant sur Entrée pour passer à la ligne suivante.

Dans l'exemple suivant, vous générez une requête pour la table publique BigQuery bigquery-public-data.austin_bikeshare.bikeshare_trips.

  1. Dans la console Google Cloud, accédez à la page BigQuery Studio.

    Accéder à BigQuery Studio

    Les étapes restantes s'affichent dans la console Google Cloud.

  2. Dans l'éditeur de requête SQL, cliquez sur  Créer une requête.

    Bouton Gemini dans la barre d'outils BigQuery.

  3. Dans l'éditeur de requêtes, écrivez un commentaire SQL sur une table que vous avez récemment consultée ou interrogée. Par exemple, vous pouvez afficher la table bigquery-public-data.austin_bikeshare.bikeshare_trips, puis écrire le commentaire suivant :

    # Show me the duration and subscriber type for the ten longest trips
    
  4. Appuyez sur Entrée (Retour sous macOS).

    Gemini suggère une requête SQL semblable à celle-ci:

    # Show me the duration and subscriber type for the ten longest trips
    
    SELECT
      duration_sec,
      subscriber_type
      AVG(duration_minutes) AS average_trip_length
    FROM
      `bigquery-public-data.austin_bikeshare.bikeshare_trips`
    ORDER BY
      duration_sec
    LIMIT 10;
    
  5. Pour accepter la suggestion, appuyez sur la touche Tabulation.

Conseils pour la génération SQL

Les conseils suivants peuvent améliorer les suggestions fournies par Gemini dans BigQuery :

  • Pour spécifier manuellement les tables à utiliser, vous pouvez inclure le nom complet de la table entre des accents graves (`), par exemple `PROJECT.DATASET.TABLE`.
  • Si les noms des colonnes ou leurs relations sémantiques sont peu clairs ou complexes, vous pouvez fournir du contexte dans la requête pour guider Gemini vers la réponse souhaitée. Par exemple, pour encourager une requête générée à référencer un nom de colonne, décrivez ce nom de colonne et sa pertinence par rapport à la réponse que vous souhaitez. Pour encourager une réponse faisant référence à des termes complexes tels que valeur vie ou marge brute, décrivez le concept et sa pertinence par rapport à vos données pour améliorer les résultats de la génération SQL.
  • Lorsque vous générez du code SQL à partir d'un commentaire, vous pouvez mettre en forme votre requête sur plusieurs lignes en ajoutant le caractère # en préfixe de chaque ligne.
  • Les descriptions de colonne sont prises en compte lors de la génération de vos requêtes SQL. Pour améliorer la précision, ajoutez des descriptions de colonnes à votre schéma. Pour en savoir plus sur les descriptions de colonnes, consultez Descriptions de colonnes dans Spécifier un schéma.

Données Gemini et BigQuery

Gemini dans BigQuery peut accéder aux métadonnées des tables auxquelles vous êtes autorisé à accéder. Il peut s'agir de noms de tables, de noms de colonnes, de types de données et de descriptions de colonnes. Gemini dans BigQuery ne peut pas accéder aux données de vos tables, vues ou modèles. Pour en savoir plus sur la manière dont Gemini utilise vos données, consultez la page Comment Gemini pour Google Cloud utilise vos données.

Exécuter une requête SQL

La complétion SQL tente de fournir des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête. Au fur et à mesure que vous tapez, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle ou vous aider à effectuer une itération sur une requête.

Pour essayer la complétion SQL avec Gemini, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page BigQuery Studio.

    Accéder à BigQuery Studio

    Les étapes restantes s'affichent dans la console Google Cloud.

  2. Dans l'éditeur de requête, copiez ce qui suit :

    SELECT
      subscriber_type
      , EXTRACT(HOUR FROM start_time) AS hour_of_day
      , AVG(duration_minutes) AS avg_trip_length
    FROM
      `bigquery-public-data.austin_bikeshare.bikeshare_trips`
    

    Un message d'erreur indique que subscriber_type n'est ni regroupé, ni agrégé. Il n'est pas rare que vous ayez besoin d'aide pour obtenir une requête correcte.

  3. Appuyez sur Entrée (Retour sous macOS) ou sur Espace.

    Gemini suggère des filtres pour la requête pouvant se terminer par un texte semblable à celui-ci :

    GROUP BY
      subscriber_type, hour_of_day;
    
  4. Pour accepter la suggestion, appuyez sur la touche Tabulation ou maintenez le pointeur sur le texte suggéré et cliquez sur les autres suggestions. Pour ignorer une suggestion, appuyez sur Échap ou poursuivez votre saisie.

Expliquer une requête SQL

Vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel. Cette explication peut vous aider à comprendre une requête dont la syntaxe, le schéma sous-jacent et le contexte commercial peuvent être difficiles à évaluer en raison de sa longueur ou de sa complexité.

Expliquer les requêtes SQL

Pour expliquer une requête SQL, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page BigQuery Studio.

    Accéder à BigQuery Studio

    Les étapes restantes s'affichent dans la console Google Cloud.

  2. Dans l'éditeur de requête, ouvrez ou collez la requête pour laquelle vous souhaitez obtenir des explications.

  3. Mettez en surbrillance la requête que vous souhaitez voir expliquée par Gemini, puis cliquez sur astrophotography_mode Gemini.

    Icône "Expliquer cette requête" et texte mis en surbrillance dans la colonne de gauche de l'éditeur de requête BigQuery.

L'explication de la requête SQL apparaît dans le volet Gemini.

Générer du code Python

Vous pouvez interroger Gemini avec une instruction ou une question en langage naturel, afin de générer du code Python. Gemini répond avec une ou plusieurs suggestions de code Python.

Utiliser Gemini pour générer du code Python

Dans l'exemple suivant, vous générez du code pour l'ensemble de données public BigQuery bigquery-public-data.ml_datasets.penguins.

  1. Accédez à la page BigQuery Studio.

    Accéder à BigQuery

  2. Dans la barre d'onglets du volet de l'éditeur, cliquez sur la flèche vers le bas à côté du signe +, puis sur Créer un notebook Python.

    Le nouveau notebook s'ouvre. Il contient des cellules dans lesquelles figurent des exemples de requêtes sur l'ensemble de données public bigquery-public-data.ml_datasets.penguins.

  3. Dans la barre d'outils, cliquez sur + Code pour insérer une nouvelle cellule de code. Une nouvelle cellule de code s'affiche et indique : Start coding or generate with AI (Commencer à coder ou générer avec l'IA).

  4. Dans la nouvelle cellule de code, cliquez sur Générer.

  5. Dans l'éditeur de code, saisissez la requête suivante en langage naturel :

    Using bigquery magics query the `bigquery-public-data.ml_datasets.penguins` table
    
  6. Appuyez sur Entrée (Retour sous macOS).

    Gemini suggère un code Python semblable à celui-ci :

    %%bigquery
    SELECT *
    FROM `bigquery-public-data.ml_datasets.penguins`
    LIMIT 10
    
  7. Exécutez le code, puis appuyez sur Entrée.

Finaliser le code Python

La complétion de code Python tente de fournir des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête. Au fur et à mesure que vous tapez, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre code actuel ou vous aider à effectuer une itération sur votre code.

Utiliser Gemini pour compléter du code Python

Pour essayer la complétion de code Python avec Gemini, procédez comme suit :

  1. Accédez à la page BigQuery Studio.

    Accéder à BigQuery

  2. Dans la barre d'onglets du volet de l'éditeur, cliquez sur la flèche vers le bas à côté du signe +, puis sur Créer un notebook Python. Le nouveau notebook s'ouvre. Il contient des cellules dans lesquelles figurent des exemples de requêtes sur l'ensemble de données public bigquery-public-data.ml_datasets.penguins.

  3. Dans l'éditeur de code, commencez à saisir du code Python. Par exemple, %%bigquery. Gemini suggère du code intégré pendant que vous tapez du texte. Pour accepter la suggestion, appuyez sur la touche Tabulation.

Désactiver les fonctionnalités de l'assistant de requête Gemini

Pour désactiver les fonctionnalités Gemini dans BigQuery, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans la barre d'outils, cliquez sur l'icône déroulante pen_spark Gemini.

    Bouton Gemini dans la barre d'outils BigQuery.

  3. Dans la liste déroulante des fonctionnalités, désélectionnez les fonctionnalités Gemini de l'assistant de requête BigQuery que vous souhaitez désactiver.

    • Gemini dans une requête SQL :
      • Saisie automatique (preview) : au fur et à mesure que vous tapez, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle ou vous aider à effectuer une itération sur une requête.
      • Génération automatique : vous pouvez fournir à Gemini une requête en langage naturel pour générer une syntaxe SQL qui répond aux questions métier.
      • Outil de génération SQL : utilisez le langage naturel pour générer et itérer les résultats de requêtes SQL en fonction des données de votre organisation.
      • Explication : vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel.
    • Gemini dans un notebook Python :
      • Complétion de code (preview) : Gemini fournit des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête.
      • Génération de code : vous pouvez interroger Gemini avec une instruction ou une question en langage naturel, afin de générer du code Python.

Pour savoir comment désactiver la fonctionnalité Gemini dans BigQuery, consultez Désactiver les produits Gemini.

Envoyer des commentaires

Vous pouvez envoyer des commentaires sur les suggestions Gemini.

  • Pour envoyer des commentaires, cliquez sur pen_spark Gemini dans la barre d'outils, puis sélectionnez Envoyer des commentaires.

Contribuer à améliorer les suggestions

Vous pouvez contribuer à améliorer les suggestions de Gemini en partageant avec Google les données de requête que vous envoyez aux fonctionnalités en mode Preview. Pour partager vos données de requête, procédez comme suit :

  1. Dans la console Google Cloud sur la page BigQuery Studio, dans la barre d'outils, cliquez surpen_spark Gemini.

  2. Sélectionnez Partager des données pour améliorer Gemini.

  3. Mettez à jour les paramètres d'utilisation des données dans la boîte de dialogue des paramètres d'utilisation des données.

Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable et serviceusage.services.list. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.

Tarifs

Pour en savoir plus sur les tarifs de cette fonctionnalité, consultez la section Présentation des tarifs de Gemini dans BigQuery.

Quotas et limites

Pour en savoir plus sur les quotas et les limites de cette fonctionnalité, consultez la page Quotas pour Gemini dans BigQuery.

Étape suivante