Résoudre les problèmes liés aux abonnements BigQuery

Cette page fournit des conseils de dépannage courants pour les abonnements BigQuery.

Vérifier l'état d'un abonnement BigQuery

Pour vérifier l'état d'un abonnement, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page des abonnements Pub/Sub.

    Accéder aux abonnements

  2. Vérifiez l'icône État de votre abonnement BigQuery.

    Si l'icône est une coche verte, l'abonnement est opérationnel.

    Si l'icône est un point d'exclamation rouge, l'abonnement est dans un état d'erreur.

  3. Cliquez sur l'abonnement BigQuery.

    La page des détails de l'abonnement s'ouvre.

  4. Recherchez le message d'erreur dans État de l'abonnement.

  5. En fonction du message d'erreur, accédez à la section appropriée de cette page pour résoudre le problème.

Une fois le problème résolu, l'abonnement revient à un état correct.

Impossible de créer ou de mettre à jour un abonnement

Voici quelques-uns des problèmes courants que vous pouvez rencontrer si vous ne parvenez pas à créer ou à mettre à jour un abonnement BigQuery.

Erreur de table introuvable

Si la table que vous spécifiez dans le workflow de création ou de mise à jour d'abonnement n'existe pas, le workflow renvoie une erreur de table introuvable. Dans la console Google Cloud, le message ressemble à celui-ci:

The BigQuery table or dataset specified cannot be found.

Pour résoudre le problème, créez la table et assurez-vous de pouvoir vérifier son état avant de l'utiliser avec un abonnement BigQuery.

Erreur de non-concordance de schéma

Si les schémas de la table et du sujet ne sont pas compatibles, le workflow de création ou de mise à jour de l'abonnement renvoie une erreur de non-concordance de schéma. Dans la console Google Cloud, le message ressemble à celui-ci:

Incompatible schema type for field project_ids: expected INT64, got STRING

Le message d'erreur spécifié concerne une incohérence de schéma pour un champ appelé project_ids. Selon le type de non-concordance de schéma que vous rencontrez, vous pouvez voir une variante différente du message d'erreur.

Pour résoudre le problème, vérifiez si les mappages de schéma sont compatibles.

Erreur de compte de service

Si vous n'avez pas configuré le compte de service Pub/Sub avec les autorisations appropriées, le workflow de création ou de mise à jour d'abonnement renvoie une erreur. Dans la console Google Cloud, le message ressemble à celui-ci:

Service account service-1234234234@gcp-sa-pubsub.iam.gserviceaccount.com
is missing permissions required to write to the BigQuery table:
bigquery.tables.get, bigquery.tables.updateData.

Pour résoudre le problème, vérifiez que le compte de service dispose des autorisations appropriées.

L'état de l'abonnement affiche un point d'exclamation rouge

Si vous modifiez la table après avoir créé un abonnement, cela peut affecter la façon dont Pub/Sub écrit des messages dans la table. Si un changement entraîne un problème, le champ d'état de l'abonnement est défini sur un état d'erreur.

Sur la page des détails de l'abonnement, vérifiez l'état du champ Subscription state. Le champ Subscription state fournit une erreur plus spécifique, qui peut être l'une des suivantes:

  • table not found (table introuvable) : la table est supprimée. Créez une table et vérifiez son état. Consultez Obtenir des informations sur les tables.

  • Autorisation de table refusée: le compte de service Pub/Sub n'est plus autorisé à écrire dans la table. Vérifiez si le compte de service dispose des autorisations appropriées.

  • Incohérence de schéma de table: le schéma de la table n'est plus compatible avec les paramètres d'abonnement BigQuery. Vérifiez si les mappages de schéma sont compatibles.

Lorsqu'un abonnement Pub/Sub est dans l'état d'erreur, les messages ne sont pas écrits dans la table BigQuery et restent dans la file d'attente de l'abonnement. Notez que les messages ne sont pas distribués à un sujet de lettres mortes associé, le cas échéant. Les messages non confirmés sont conservés pendant la période définie dans message_retention_duration(7 jours par défaut).

Un arriéré se forme

Si vous constatez que des messages s'accumulent dans l'abonnement ou sont envoyés à la file d'attente de lettres mortes d'un abonnement, examinez les causes possibles ci-dessous.

Message d'erreur INVALID_ARGUMENT

Cette erreur se produit lorsque le message fourni est au format que Pub/Sub considère comme valide, mais que le schéma de la table de destination BigQuery ne le fait pas. Cela signifie qu'un ou plusieurs champs du message contiennent des valeurs non autorisées par le schéma de la table BigQuery. Vérifiez la compatibilité du schéma pour vous assurer que les types et formats de données sont corrects. Voici quelques-unes des erreurs les plus courantes:

  • Une chaîne vide ("") n'est pas un fichier JSON valide. Lorsque vous envoyez des données à une colonne de table BigQuery JSON nullable, fournissez un objet JSON vide ({}), null ou une chaîne JSON vide ("\"\"") pour représenter les valeurs manquantes. L'envoi d'une chaîne vide génère une erreur.

  • Si la valeur d'un champ de message dépasse la longueur maximale du champ BigQuery, le message échoue en raison de limitations de taille.

Pour résoudre les erreurs INVALID_ARGUMENT, ajoutez un sujet de lettres mortes à l'abonnement concerné. Le sujet de lettre morte capture les messages qui n'ont pas pu être écrits dans BigQuery, ainsi qu'un attribut appelé CloudPubSubDeadLetterSourceDeliveryErrorMessage qui explique le motif de l'échec.

Ces échecs de diffusion sont également visibles dans l'explorateur de métriques. Sélectionnez la métrique pubsub.googleapis.com/subscription/push_request_count et filtrez par response_code=invalid_argument.

Message d'erreur RESOURCE_EXHAUSTED

Si les messages sont écrits lentement dans BigQuery, vous devrez peut-être augmenter le quota de transfert Pub/Sub ou le quota de débit d'écriture de l'espace de stockage BigQuery de votre projet. Pour vérifier si vous rencontrez des limites de quota, examinez la métrique des requêtes push (subscription/push_request_count) pour détecter d'éventuelles erreurs resource_exhausted.

Une autre façon de diagnostiquer les problèmes de quota consiste à vérifier le quota du projet. Accédez à IAM et administration > Quotas dans le projet contenant votre ressource Pub/Sub ou votre instance BigQuery. Recherchez le quota approprié, pubsub.googleapis.com/regionalpushsubscriber ou bigquerystorage.googleapis.com/write/append_bytes. Si l'un de ces quotas doit être augmenté, vous pouvez demander une augmentation de quota.

Table partitionnée par heure affichant __UNPARTITIONED__ dans la colonne d'ID de partition

Lorsqu'une table de destination BigQuery est partitionnée par heure, les lignes se retrouvent initialement dans une partition spéciale intitulée __UNPARTITIONED__ dans la vue INFORMATION_SCHEMA.PARTITIONS. Ce comportement est normal pour les tables qui utilisent le partitionnement par date d'ingestion.

BigQuery utilise un tampon de flux continu pour optimiser le processus d'écriture. Les données peuvent résider dans la partition __UNPARTITIONED__ jusqu'à ce qu'un volume suffisant s'accumule ou qu'au moins une heure se soit écoulée. Une fois ces conditions remplies, BigQuery repartitionne les données dans la partition horaire appropriée.

Vous pouvez surveiller les données de la partition __UNPARTITIONED__ à l'aide de la vue INFORMATION_SCHEMA.PARTITIONS.

Étape suivante

  • Si le problème persiste avec votre abonnement BigQuery, consultez Obtenir de l'aide.