Rédiger des requêtes avec l'aide de Gemini
Vous pouvez utiliser Gemini pour Google Cloud, qui propose une assistance basée sur l'IA, pour vous aider à interroger vos données à l'aide de requêtes SQL et de code Python. Gemini dans BigQuery peut générer des requêtes, compléter le code à mesure que vous tapez du texte et expliquer les requêtes.
Sans votre autorisation expresse, Gemini pour Google Cloud n'utilise pas vos requêtes ni ses réponses comme des données destinées à l'entraînement de ses modèles. Pour en savoir plus sur la manière dont Google utilise vos données, consultez la section Utilisation de vos données par Gemini pour Google Cloud. Pour savoir comment accepter le partage de données pour les fonctionnalités Gemini dans BigQuery en version preview, consultez la section Contribuer à améliorer les suggestions.
Gemini dans BigQuery n'accepte que des requêtes en anglais.
Ce document est destiné aux analystes de données, aux data scientists et aux développeurs de données qui travaillent avec des requêtes SQL et des notebooks Colab Enterprise dans BigQuery. Nous partons du principe que vous savez interroger des données dans l'espace de travail SQL BigQuery ou utiliser des notebooks pour analyser des données BigQuery à l'aide de Python.
Avant de commencer
- Assurez-vous que Gemini est configuré pour votre projet Google Cloud. Les fonctionnalités Gemini dans BigQuery peuvent être désactivées ou indisponibles jusqu'à la fin de la configuration. Ces étapes sont généralement effectuées par un administrateur.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Dans la console Google Cloud, accédez à la page BigQuery.
Dans la barre d'outils, cliquez sur l'icône déroulante pen_spark Gemini.
Dans la liste déroulante des fonctionnalités, sélectionnez celles que vous souhaitez activer. Les fonctionnalités disponibles sont les suivantes :
- Gemini dans une requête SQL :
- Saisie semi-automatique (preview) : au fur et à mesure que vous tapez du texte dans l'éditeur de requête, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle, ou vous aider à effectuer une itération sur une requête.
- Génération automatique : vous pouvez demander à Gemini dans BigQuery de générer une requête SQL à l'aide d'un commentaire en langage naturel, tapé dans l'éditeur de requête BigQuery.
- Outil de génération SQL : vous pouvez taper du texte en langage naturel dans un outil pour générer une requête SQL, avec des options permettant d'affiner les résultats de la requête, de choisir les sources de tables et de comparer les résultats.
- Explication : vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel.
- Gemini dans un notebook Python :
- Complétion de code (preview) : Gemini fournit des recommandations contextuelles appropriées basées sur le contenu du notebook.
- Génération de code : vous pouvez interroger Gemini avec une instruction ou une question en langage naturel, afin de générer du code Python.
- Gemini dans une requête SQL :
Autorisations requises
Pour obtenir les autorisations nécessaires pour écrire des requêtes avec l'assistance Gemini, demandez à votre administrateur de vous accorder le rôle IAM Utilisateur de Gemini pour Google Cloud (roles/cloudaicompanion.user
) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Ce rôle prédéfini contient les autorisations requises pour écrire des requêtes avec l'assistance Gemini. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Vous devez disposer des autorisations suivantes pour écrire des requêtes avec l'assistance Gemini :
-
cloudaicompanion.entitlements.get
-
cloudaicompanion.instances.completeTask
-
Pour expliquer les requêtes SQL :
cloudaicompanion.companions.generateChat
-
Pour compléter du code SQL ou Python :
cloudaicompanion.instances.completeCode
-
Pour générer du code SQL ou Python :
cloudaicompanion.instances.generateCode
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Générer une requête SQL
Pour générer une requête SQL basée sur le schéma de vos données, vous pouvez fournir à Gemini une instruction ou une question en langage naturel, également appelée requête. Même si vous débutez sans la moindre portion de code, que vous n'avez que des connaissances limitées sur le schéma de données ou bien seulement des connaissances de base sur la syntaxe GoogleSQL, Gemini peut générer du code SQL qui peut vous aider à explorer vos données.Utiliser l'outil de génération SQL
L'outil de génération de SQL vous permet d'utiliser le langage naturel pour générer une requête SQL sur les tables que vous avez consultées ou interrogées récemment. Vous pouvez également utiliser l'outil pour modifier une requête existante et spécifier manuellement les tables pour lesquelles vous souhaitez générer du code SQL.
Procédez comme suit pour utiliser l'outil de génération SQL :
Dans la console Google Cloud, accédez à la page BigQuery.
À côté de l'éditeur de requête, cliquez sur pen_spark Outil de génération SQL.
À gauche de l'éditeur de requête, cliquez sur l'icône pen_spark Outil de génération SQL pour ouvrir l'outil.
Dans l'outil de génération SQL, posez une question ou saisissez une requête en langage naturel concernant une table que vous avez récemment consultée ou interrogée. Par exemple, vous pouvez afficher la table bigquery-public-data.austin_bikeshare.bikeshare_trips, puis taper le commentaire suivant :
Show me the duration and subscriber type for the ten longest trips
Cliquez sur Générer.
Gemini génère une requête SQL semblable à celle-ci :
SELECT subscriber_type, duration_sec FROM `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips` ORDER BY duration_sec DESC LIMIT 10;
Examinez la requête SQL générée et effectuez l'une des actions suivantes:
- Pour accepter la requête SQL générée, cliquez sur Insérer pour insérer l'instruction dans l'éditeur de requête. Vous pouvez ensuite cliquer sur Exécuter pour exécuter la requête SQL suggérée.
- Pour modifier votre requête, cliquez sur Modifier, puis modifiez ou remplacez votre requête initiale. Une fois que vous avez modifié votre requête, cliquez sur Mettre à jour pour afficher la nouvelle requête.
- Pour mettre à jour les sources de tables utilisées comme contexte pour générer la requête SQL suggérée, cliquez sur Modifier les sources des tables, sélectionnez les sources de tables en cochant les cases correspondantes, puis cliquez sur Appliquer.
- Pour afficher un résumé en langage naturel de la requête générée, cliquez sur Récapitulatif de la requête.
- Pour affiner la requête SQL suggérée, tapez des ajustements dans la zone de texte Affiner, puis cliquez sur
limit to 1000
pour limiter le nombre de résultats de la requête. Pour comparer les modifications apportées à votre requête, cochez la case Afficher le différentiel.
Envoyer pour affiner votre requête. Par exemple, tapez - Pour ignorer la suggestion et ne pas insérer la requête générée, fermez l'outil de génération SQL.
Désactiver l'outil de génération SQL
Pour savoir comment désactiver l'outil de génération SQL, consultez la section Désactiver les fonctionnalités Gemini.
Générer du code SQL à partir d'un commentaire
Vous pouvez générer du code SQL dans l'éditeur SQL en décrivant la requête souhaitée dans un commentaire, puis en appuyant sur Entrée pour passer à la ligne suivante.
Dans l'exemple suivant, vous générez une requête pour la table publique BigQuery bigquery-public-data.austin_bikeshare.bikeshare_trips
.
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Les étapes restantes s'affichent dans la console Google Cloud.
Dans l'éditeur de requête SQL, cliquez sur
. Créer une requête Dans l'éditeur de requêtes, écrivez un commentaire SQL sur une table que vous avez récemment consultée ou interrogée. Par exemple, vous pouvez afficher la table bigquery-public-data.austin_bikeshare.bikeshare_trips, puis écrire le commentaire suivant :
# Show me the duration and subscriber type for the ten longest trips
Appuyez sur Entrée (Retour sous macOS).
Gemini suggère une requête SQL semblable à celle-ci:
# Show me the duration and subscriber type for the ten longest trips SELECT duration_sec, subscriber_type AVG(duration_minutes) AS average_trip_length FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips` ORDER BY duration_sec LIMIT 10;
Pour accepter la suggestion, appuyez sur la touche Tabulation.
Conseils pour la génération SQL
Les conseils suivants peuvent améliorer les suggestions fournies par Gemini dans BigQuery :
- Pour spécifier manuellement les tables à utiliser, vous pouvez inclure le nom complet de la table entre des accents graves (
`
), par exemple`PROJECT.DATASET.TABLE`
. - Si les noms des colonnes ou leurs relations sémantiques sont peu clairs ou complexes, vous pouvez fournir du contexte dans la requête pour guider Gemini vers la réponse souhaitée. Par exemple, pour encourager une requête générée à référencer un nom de colonne, décrivez ce nom de colonne et sa pertinence par rapport à la réponse que vous souhaitez. Pour encourager une réponse faisant référence à des termes complexes tels que valeur vie ou marge brute, décrivez le concept et sa pertinence par rapport à vos données pour améliorer les résultats de la génération SQL.
- Lorsque vous générez du code SQL à partir d'un commentaire, vous pouvez mettre en forme votre requête sur plusieurs lignes en ajoutant le caractère
#
en préfixe de chaque ligne. - Les descriptions de colonne sont prises en compte lors de la génération de vos requêtes SQL. Pour améliorer la précision, ajoutez des descriptions de colonnes à votre schéma. Pour en savoir plus sur les descriptions de colonnes, consultez Descriptions de colonnes dans Spécifier un schéma.
Données Gemini et BigQuery
Gemini dans BigQuery peut accéder aux métadonnées des tables auxquelles vous êtes autorisé à accéder. Il peut s'agir de noms de tables, de noms de colonnes, de types de données et de descriptions de colonnes. Gemini dans BigQuery ne peut pas accéder aux données de vos tables, vues ou modèles. Pour en savoir plus sur la manière dont Gemini utilise vos données, consultez la page Comment Gemini pour Google Cloud utilise vos données.
Exécuter une requête SQL
La complétion SQL tente de fournir des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête. Au fur et à mesure que vous tapez, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle ou vous aider à effectuer une itération sur une requête.
Pour essayer la complétion SQL avec Gemini, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Les étapes restantes s'affichent dans la console Google Cloud.
Dans l'éditeur de requête, copiez ce qui suit :
SELECT subscriber_type , EXTRACT(HOUR FROM start_time) AS hour_of_day , AVG(duration_minutes) AS avg_trip_length FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips`
Un message d'erreur indique que
subscriber_type
n'est ni regroupé, ni agrégé. Il n'est pas rare que vous ayez besoin d'aide pour obtenir une requête correcte.Appuyez sur Entrée (Retour sous macOS) ou sur Espace.
Gemini suggère des filtres pour la requête pouvant se terminer par un texte semblable à celui-ci :
GROUP BY subscriber_type, hour_of_day;
Pour accepter la suggestion, appuyez sur la touche Tabulation ou maintenez le pointeur sur le texte suggéré et cliquez sur les autres suggestions. Pour ignorer une suggestion, appuyez sur Échap ou poursuivez votre saisie.
Expliquer une requête SQL
Vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel. Cette explication peut vous aider à comprendre une requête dont la syntaxe, le schéma sous-jacent et le contexte commercial peuvent être difficiles à évaluer en raison de sa longueur ou de sa complexité.
Expliquer les requêtes SQL
Pour expliquer une requête SQL, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Les étapes restantes s'affichent dans la console Google Cloud.
Dans l'éditeur de requête, ouvrez ou collez la requête pour laquelle vous souhaitez obtenir des explications.
Mettez en surbrillance la requête que vous souhaitez voir expliquée par Gemini, puis cliquez sur astrophotography_mode Gemini.
L'explication de la requête SQL apparaît dans le volet Gemini.
Générer du code Python
Vous pouvez interroger Gemini avec une instruction ou une question en langage naturel, afin de générer du code Python. Gemini répond avec une ou plusieurs suggestions de code Python.
Utiliser Gemini pour générer du code Python
Dans l'exemple suivant, vous générez du code pour l'ensemble de données public BigQuery bigquery-public-data.ml_datasets.penguins
.
Accédez à la page BigQuery Studio.
Dans la barre d'onglets du volet de l'éditeur, cliquez sur
la flèche vers le bas à côté du signe +, puis sur Créer un notebook Python.Le nouveau notebook s'ouvre. Il contient des cellules dans lesquelles figurent des exemples de requêtes sur l'ensemble de données public
bigquery-public-data.ml_datasets.penguins
.Dans la barre d'outils, cliquez sur + Code pour insérer une nouvelle cellule de code. Une nouvelle cellule de code s'affiche et indique : Start coding or generate with AI (Commencer à coder ou générer avec l'IA).
Dans la nouvelle cellule de code, cliquez sur Générer.
Dans l'éditeur de code, saisissez la requête suivante en langage naturel :
Using bigquery magics query the `bigquery-public-data.ml_datasets.penguins` table
Appuyez sur Entrée (Retour sous macOS).
Gemini suggère un code Python semblable à celui-ci :
%%bigquery SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 10
Exécutez le code, puis appuyez sur Entrée.
Finaliser le code Python
La complétion de code Python tente de fournir des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête. Au fur et à mesure que vous tapez, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre code actuel ou vous aider à effectuer une itération sur votre code.
Utiliser Gemini pour compléter du code Python
Pour essayer la complétion de code Python avec Gemini, procédez comme suit :
Accédez à la page BigQuery Studio.
Dans la barre d'onglets du volet de l'éditeur, cliquez sur
la flèche vers le bas à côté du signe +, puis sur Créer un notebook Python. Le nouveau notebook s'ouvre. Il contient des cellules dans lesquelles figurent des exemples de requêtes sur l'ensemble de données publicbigquery-public-data.ml_datasets.penguins
.Dans l'éditeur de code, commencez à saisir du code Python. Par exemple,
%%bigquery
. Gemini suggère du code intégré pendant que vous tapez du texte. Pour accepter la suggestion, appuyez sur la touche Tabulation.
Désactiver les fonctionnalités de l'assistant de requête Gemini
Pour désactiver les fonctionnalités Gemini dans BigQuery, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery.
Dans la barre d'outils, cliquez sur l'icône déroulante pen_spark
Gemini .Dans la liste déroulante des fonctionnalités, désélectionnez les fonctionnalités Gemini de l'assistant de requête BigQuery que vous souhaitez désactiver.
- Gemini dans une requête SQL :
- Saisie automatique (preview) : au fur et à mesure que vous tapez, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle ou vous aider à effectuer une itération sur une requête.
- Génération automatique : vous pouvez fournir à Gemini une requête en langage naturel pour générer une syntaxe SQL qui répond aux questions métier.
- Outil de génération SQL : utilisez le langage naturel pour générer et itérer les résultats de requêtes SQL en fonction des données de votre organisation.
- Explication : vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel.
- Gemini dans un notebook Python :
- Complétion de code (preview) : Gemini fournit des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête.
- Génération de code : vous pouvez interroger Gemini avec une instruction ou une question en langage naturel, afin de générer du code Python.
- Gemini dans une requête SQL :
Pour savoir comment désactiver la fonctionnalité Gemini dans BigQuery, consultez Désactiver les produits Gemini.
Envoyer des commentaires
Vous pouvez envoyer des commentaires sur les suggestions Gemini.
- Pour envoyer des commentaires, cliquez sur pen_spark
Gemini dans la barre d'outils, puis sélectionnez Envoyer des commentaires.
Contribuer à améliorer les suggestions
Vous pouvez contribuer à améliorer les suggestions de Gemini en partageant avec Google les données de requête que vous envoyez aux fonctionnalités en mode Preview. Pour partager vos données de requête, procédez comme suit :
Dans la console Google Cloud sur la page BigQuery Studio, dans la barre d'outils, cliquez surpen_spark
Gemini .Sélectionnez Partager des données pour améliorer Gemini.
Mettez à jour les paramètres d'utilisation des données dans la boîte de dialogue des paramètres d'utilisation des données.
Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable
et serviceusage.services.list
. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.
Tarifs
Pour en savoir plus sur les tarifs de cette fonctionnalité, consultez la section Présentation des tarifs de Gemini dans BigQuery.
Quotas et limites
Pour en savoir plus sur les quotas et les limites de cette fonctionnalité, consultez la page Quotas pour Gemini dans BigQuery.
Étape suivante
- Pour en savoir plus sur Gemini pour Google Cloud, consultez la présentation de Gemini pour Google Cloud.
- Pour en savoir plus sur les règles relatives aux données Gemini, consultez Comment Gemini pour Google Cloud utilise vos données.