Questo documento descrive come aggiungere campi LogEntry
indicizzati ai bucket di Cloud Logging per eseguire più velocemente query sui dati dei log.
Panoramica
Le prestazioni delle query sono fondamentali per qualsiasi soluzione di logging. Man mano che i carichi di lavoro aumentano e i volumi di log corrispondenti aumentano, l'indicizzazione dei dati dei log più utilizzati può ridurre i tempi di query.
Per migliorare le prestazioni delle query, la registrazione indicizza automaticamente i seguenti campi LogEntry
:
- resource.type
- resource.labels.*
- logName
- severity
- timestamp
- insertId
- operation.id
- trace
- httpRequest.status
- labels.*
- split.uid
Oltre ai campi indicizzati automaticamente da Logging, puoi anche indicare a un bucket di log di indicizzare altri campi LogEntry
creando un indice personalizzato per il bucket.
Ad esempio, supponiamo che le espressioni di query includano spesso il campojsonPayload.request.status
. Puoi configurare un indice personalizzato per un bucket che include jsonPayload.request.status
. Qualsiasi query successiva sui dati di quel bucket farà riferimento ai dati jsonPayload.request.status
indicizzati se l'espressione di query include questo campo.
Utilizzando Google Cloud CLI o l'API Logging, puoi aggiungere indici personalizzati ai bucket di log esistenti o nuovi. Quando selezioni altri campi da includere nell'indice personalizzato, tieni presente le seguenti limitazioni:
- Puoi aggiungere fino a 20 campi per indice personalizzato.
- Dopo aver configurato o aggiornato l'indice personalizzato di un bucket, devi attendere un'ora affinché le modifiche vengano applicate alle query. Questa latenza garantisce la correttezza dei risultati delle query e accetta i log scritti in passato.
- La registrazione applica l'indicizzazione personalizzata ai dati archiviati nei bucket di log dopo la creazione o la modifica dell'indice. Le modifiche agli indici personalizzati non vengono applicate ai log in modo retroattivo.
Prima di iniziare
Prima di iniziare a configurare un indice personalizzato:
Verifica di utilizzare la versione più recente della CLI gcloud. Per ulteriori informazioni, consulta Gestire i componenti della CLI Google Cloud.
Verifica di disporre di un ruolo Identity and Access Management con le seguenti autorizzazioni:
Per informazioni dettagliate su questi ruoli, consulta Controllo dell'accesso con IAM.
Definisci l'indice personalizzato
Per ogni campo aggiunto all'indice personalizzato di un bucket, definisci due attributi: un percorso del campo e un tipo di campo:
fieldPath
: descrive il percorso specifico al campoLogEntry
nelle voci di log. Ad esempio:jsonPayload.req_status
.type
: indica se il campo è di tipo stringa o numero intero. I valori possibili sonoINDEX_TYPE_STRING
eINDEX_TYPE_INTEGER
.
Un indice personalizzato può essere aggiunto creando un nuovo bucket o aggiornandone uno esistente. Per ulteriori informazioni sulla configurazione dei bucket, consulta la sezione Configurare i bucket di log.
Per configurare un indice personalizzato durante la creazione di un bucket:
gcloud
Utilizza il comando
gcloud logging buckets create
e imposta il flag --index
:
gcloud logging buckets create BUCKET_NAME\ --location=LOCATION\ --description="DESCRIPTION" \ --index=fieldPath=INDEX_FIELD_NAME,type=INDEX_TYPE
Comando di esempio:
gcloud logging buckets create int_index_test_bucket \ --location=global \ --description="Bucket with integer index" \ --index=fieldPath=jsonPayload.req_status,type=INDEX_TYPE_INTEGER
API
Per creare un bucket, utilizza
projects.locations.buckets.create
nell'API Logging. Prepara gli argomenti del metodo come segue:
Imposta il parametro
parent
in modo che corrisponda alla risorsa in cui creare il bucket:projects/PROJECT_ID/locations/LOCATION
La variabile LOCATION si riferisce alla regione in cui vuoi che vengano archiviati i log.
Ad esempio, se vuoi creare un bucket per il progetto
my-project
nella regioneasia-east2
, il parametroparent
sarà simile a questo:projects/my-project/locations/asia-east2
Imposta il parametro
bucketId
, ad esempiomy-bucket
.Nel corpo della richiesta
LogBucket
, configura l'oggettoIndexConfig
per creare l'indice personalizzato.Chiama
projects.locations.buckets.create
per creare il bucket.
Per aggiornare un bucket esistente in modo da includere un indice personalizzato:
gcloud
Utilizza il comando
gcloud logging buckets update
e imposta il flag --add-index
:
gcloud logging buckets update BUCKET_NAME\ --location=LOCATION\ --add-index=fieldPath=INDEX_FIELD_NAME,type=INDEX_TYPE
Comando di esempio:
gcloud logging buckets update \ int_index_test_bucket \ --location=global \ --add-index=fieldPath=jsonPayload.req_status,type=INDEX_TYPE_INTEGER
API
Utilizza
projects.locations.buckets.patch
nell'API Logging. Nel corpo della richiesta LogBucket
, configura l'oggetto IndexConfig
in modo da includere i campi LogEntry
che vuoi indicizzare.
Eliminare un campo indicizzato personalizzato
Per eliminare un campo dall'indice personalizzato di un bucket:
gcloud
Utilizza il comando
gcloud logging buckets update
e imposta il flag --remove-indexes
:
gcloud logging buckets update BUCKET_NAME\ --location=LOCATION\ --remove-indexes=INDEX_FIELD_NAME
Comando di esempio:
gcloud logging buckets update int_index_test_bucket \ --location=global \ --remove-indexes=jsonPayload.req_status
API
Utilizza
projects.locations.buckets.patch
nell'API Logging. Nel
corpo della richiesta LogBucket
,
rimuovi i campi LogEntry
dall'objeto
IndexConfig
.
Aggiorna il tipo di dati del campo indicizzato personalizzato
Se devi correggere il tipo di dati di un campo indicizzato personalizzato:
gcloud
Utilizza il comando
gcloud logging buckets update
e imposta il flag --update-index
:
gcloud logging buckets update BUCKET_NAME\ --location=LOCATION\ --update-index=fieldPath=INDEX_FIELD_NAME,type=INDEX_TYPE
Comando di esempio:
gcloud logging buckets update \ int_index_test_bucket \ --location=global \ --update-index=fieldPath=jsonPayload.req_status,type=INDEX_TYPE_INTEGER
API
Utilizza projects.locations.buckets.patch
nell'API Logging. Nel corpo della richiesta
LogBucket
, aggiorna l'oggetto
IndexConfig
per fornire
il tipo di dati corretto per un campo LogEntry
.
Aggiornare il percorso di un campo indicizzato personalizzato
Se devi correggere il percorso del campo di un campo indicizzato personalizzato:
gcloud
Utilizza il comando
gcloud logging buckets update
e imposta i flag --remove-indexes
e --update-index
:
gcloud logging buckets update BUCKET_NAME\ --location=LOCATION\ --remove-indexes=OLD_INDEX_FIELD_NAME \ --update-index=fieldPath=NEW_INDEX_FIELD_NAME,type=INDEX_TYPE
Comando di esempio:
gcloud logging buckets update \ int_index_test_bucket \ --location=global \ --remove-indexes=jsonPayload.req_status_old_path \ --add-index=fieldPath=jsonPayload.req_status_new_path,type=INDEX_TYPE_INTEGER
API
Utilizza
projects.locations.buckets.patch
nell'API Logging. Nel corpo della richiesta LogBucket
, aggiorna l'oggetto IndexConfig
per fornire il percorso del campo corretto per un campo LogEntry
.
Elenca tutti i campi indicizzati per un bucket
Per elencare i dettagli di un bucket, inclusi i campi indicizzati personalizzati, segui questi passaggi:
gcloud
Utilizza il comando
gcloud logging buckets describe
:
gcloud logging buckets describe BUCKET_NAME\ --location=LOCATION
Comando di esempio:
gcloud logging buckets describe indexed-bucket \ --location global
API
Utilizza projects.locations.buckets.get
nell'API Logging.
Cancellare i campi indicizzati personalizzati
Per rimuovere tutti i campi indicizzati personalizzati da un bucket:
gcloud
Utilizza il comando
gcloud logging buckets update
e aggiungi il flag --clear-indexes
:
gcloud logging buckets update BUCKET_NAME\ --location=LOCATION\ --clear-indexes
Comando di esempio:
gcloud logging buckets update \ int_index_test_bucket \ --location=global \ --clear-indexes
API
Utilizza
projects.locations.buckets.patch
nell'API Logging. Nel corpo della richiesta
LogBucket
, elimina l'oggetto
IndexConfig
.
Esegui query e visualizza i dati indicizzati
Per eseguire query sui dati inclusi nei campi indicizzati personalizzati, limita l'ambito della query al bucket contenente i campi indicizzati personalizzati e specifica la visualizzazione dei log appropriata:
gcloud
Per leggere i log da un bucket di log, utilizza il comando
gcloud logging read e aggiungi un
LOG_FILTER
per includere
i dati indicizzati:
gcloud logging read LOG_FILTER --bucket=BUCKET_ID --location=LOCATION --view=VIEW_ID
API
Per leggere i log da un bucket di log, utilizza il metodo
entries.list
. Imposta
resourceNames
per specificare il bucket e la visualizzazione del log appropriati e imposta
resourceNames
per selezionare i dati indicizzati.filter
Per informazioni dettagliate sulla sintassi di filtro, consulta Lingua delle query di Logging.
Indicizzazione e tipi di campo
Il modo in cui configuri l'indicizzazione dei campi personalizzati può influire sul modo in cui i log vengono archiviati nei bucket dei log e su come vengono elaborate le query.
Al momento della scrittura
La registrazione tenta di utilizzare l'indice personalizzato sui dati memorizzati nei bucket di log dopo la creazione dell'indice.
I campi indicizzati sono digitati, il che ha implicazioni per il timestamp nella voce di log. Quando la voce di log viene archiviata nel bucket di log, il campo del log viene valutato in base al tipo di indice utilizzando queste regole:
- Se il tipo di un campo corrisponde a quello dell'indice, i dati vengono aggiunti all'indice esattamente come sono.
- Se il tipo di campo è diverso da quello dell'indice, il logging tenta di forzarlo nel tipo dell'indice (ad esempio, da numero intero a stringa).
- Se la coercizione del tipo non riesce, i dati non vengono indicizzati. Quando la coercizione del tipo riesce, i dati vengono indicizzati.
Al momento della query
L'attivazione di un indice su un campo modifica il modo in cui devi eseguire query su quel campo. Per impostazione predefinita, la funzionalità di registrazione applica i vincoli di filtro ai campi in base al tipo di dati in ogni voce di log in fase di valutazione. Quando l'indicizzazione è attivata, i vincoli di filtro su un campo vengono applicati in base al tipo di indice. L'aggiunta di un indice a un campo impone uno schema a quel campo.
Quando per un bucket è configurato un indice personalizzato, i comportamenti di corrispondenza allo schema differiscono quando si verificano entrambe le seguenti condizioni:
- Il tipo di dati di origine per un campo non corrisponde al tipo di indice per quel campo.
- L'utente applica una limitazione a quel campo.
Considera i seguenti payload JSON:
{"jsonPayload": {"name": "A", "value": 12345}} {"jsonPayload": {"name": "B", "value": "3"}}
Ora applica questo filtro a ogni riga:
jsonPayload.value > 20
Se il campo jsonPayoad.value
non dispone di indicizzazione personalizzata, il logging applica la corrispondenza di tipo flessibile:
Per "A", la registrazione osserva che il valore della chiave "value" è effettivamente un numero intero e che il vincolo "20" può essere convertito in un numero intero. La registrazione valuta quindi
12345 > 20
e restituisce "true" perché è così numericamente.Per "B", il logging rileva che il valore della chiave "value" è in realtà una stringa. Poi valuta
"3" > "20"
e restituisce "true", poiché è il caso alfanumerico.
Se il campo jsonPayload.value
è incluso nell'indice personalizzato, la registrazione valuta questo vincolo utilizzando l'indice anziché la consueta logica di registrazione. Il comportamento cambia:
- Se l'indice è di tipo stringa, tutti i confronti sono confronti di stringhe.
- La voce "A" non corrisponde, poiché "12345" non è maggiore di "20" alfabeticamente. La voce "B" corrisponde, poiché la stringa "3" è maggiore di "20".
- Se l'indice è di tipo intero, tutti i confronti sono confronti di interi.
- La voce "B" non corrisponde, poiché "3" non è numericamente maggiore di "20". La voce "A" corrisponde, poiché "12345" è maggiore di "20".
Questa differenza di comportamento è sottile e deve essere presa in considerazione quando si definiscono e si utilizzano gli indici personalizzati.
Caso limite di filtro
Per l'indice di tipo intero jsonPayload.value
, supponiamo che un valore di stringa sia filtrato:
jsonPayload.value = "hello"
Se non è possibile forzare il valore della query al tipo di indice, l'indice viene ignorato.
Tuttavia, supponiamo che per un indice di tipo stringa tu passi un valore intero:
jsonPayload.value > 50
Né A né B corrispondono, poiché né "12345" né "3" sono alfabeticamente superiori a "50".