Che cos'è BI Engine?

BigQuery BI Engine è un servizio di analisi in memoria rapido che accelera molte query SQL in BigQuery memorizzando in modo intelligente nella cache i dati che utilizzi più spesso. BI Engine può accelerare le query SQL da qualsiasi origine, incluse quelle scritte dagli strumenti di visualizzazione dei dati, e può gestire le tabelle memorizzate nella cache per l'ottimizzazione continua. In questo modo puoi migliorare le prestazioni delle query senza regolazioni manuali o gerarchie di dati. Puoi utilizzare il clustering e il partizionamento per ottimizzare ulteriormente il rendimento delle tabelle di grandi dimensioni con BI Engine.

Ad esempio, se la dashboard mostra solo i dati dell'ultimo trimestre, valuta la possibilità di partizionare le tabelle in base al tempo in modo che solo le partizioni più recenti vengano caricate in memoria. Puoi anche combinare i vantaggi delle visualizzazioni materializzate e di BI Engine. Questo funziona particolarmente bene quando le viste materializzate vengono utilizzate per unire e appianare i dati al fine di ottimizzarne la struttura per BI Engine.

BI Engine offre i seguenti vantaggi:

  1. API BigQuery: BI Engine si integra direttamente con l'API BigQuery. Qualsiasi soluzione di BI o applicazione personalizzata che funzioni con l'API BigQuery tramite meccanismi standard come REST o driver JDBC e ODBC può utilizzare BI Engine senza modifiche.
  2. Runtime vettore:con l'interfaccia SQL di BI Engine, BI Engine introduce una tecnica più moderna chiamata elaborazione vettore. L'utilizzo dell'elaborazione vettoriale in un motore di esecuzione consente di utilizzare in modo più efficiente l'architettura moderna delle CPU, operando su batch di dati alla volta. BI Engine utilizza anche codifiche dei dati avanzate, in particolare la codifica di dizionario e la codifica run-length, per comprimere ulteriormente i dati archiviati nel livello in memoria.
  3. Integrazione perfetta: BI Engine funziona con le funzionalità e i metadati di BigQuery, tra cui visualizzazioni autorizzate, sicurezza a livello di riga e colonna e mascheramento dei dati.
  4. Prenotazioni:le prenotazioni di BI Engine gestiscono l'allocazione della memoria a livello di località del progetto. BI Engine memorizza nella cache colonne o partizioni specifiche su cui vengono eseguite query, dando la priorità a quelle nelle tabelle contrassegnate come preferite.

Informazioni sull'interfaccia SQL di BI Engine

L'interfaccia SQL di BI Engine consente di integrare BI Engine con altri strumenti di business intelligence (BI) come Looker, Tableau, Power BI e applicazioni personalizzate per accelerare l'esplorazione e l'analisi dei dati. Questa pagina fornisce una panoramica dell'interfaccia SQL di BI Engine e delle funzionalità ampliate che offre a BI Engine.

Architettura di BI Engine

Casi d'uso di BI Engine

BI Engine può accelerare in modo significativo molte query SQL, tra cui quelle utilizzate per le dashboard di Business Intelligence. L'accelerazione è più efficace se identifichi le tabelle essenziali per le tue query e poi le contrassegni come tabelle preferite. Per utilizzare BI Engine, crea una prenotazione che definisce la capacità di archiviazione dedicata a BI Engine. Puoi lasciare che sia BigQuery a determinare quali tabelle memorizzare nella cache in base ai modelli di utilizzo del progetto oppure puoi contrassegnare tabelle specifiche per impedire ad altro traffico di interferire con l'accelerazione.

BI Engine è utile nei seguenti casi d'uso:

  • Utilizzi strumenti di business intelligence per analizzare i dati: l'interfaccia SQL di BI Engine può accelerare le query BigQuery indipendentemente dal fatto che vengano eseguite nella console BigQuery, nella libreria client o tramite un'API o un connettore ODBC o JDBC. In questo modo, puoi migliorare notevolmente le prestazioni delle dashboard collegate a BigQuery tramite una connessione integrata (API) o connettori.
  • Esegui query su determinate tabelle più di frequente: BI Engine ti consente di designare tabelle preferite specifiche da accelerare. Questa opzione è utile se hai un sottoinsieme di tabelle su cui vengono eseguite query più di frequente o che vengono utilizzate per dashboard ad alta visibilità.

BI Engine potrebbe non soddisfare le tue esigenze nei seguenti casi:

  • Utilizzi i caratteri jolly nelle query: le query che fanno riferimento a tabelle con caratteri jolly non sono supportate da BI Engine e non beneficiano dell'accelerazione.

  • Fai molto affidamento su funzionalità di BigQuery non supportate: anche se BI Engine supporta la maggior parte delle funzioni e degli operatori SQL quando colleghi gli strumenti di business intelligence (BI) a BigQuery, esistono funzionalità non supportate, tra cui tabelle esterne e funzioni definite dall'utente non SQL.

Considerazioni per BI Engine

Quando decidi come configurare BI Engine, tieni presente quanto segue:

Garantire l'accelerazione per query specifiche

Puoi assicurarti che un determinato insieme di query venga sempre accelerato creando un progetto distinto con una prenotazione BI Engine. Per farlo, devi assicurarti che la prenotazione di BI Engine nel progetto sia sufficientemente grande da corrispondere alle dimensioni di tutte le tabelle utilizzate in queste query e designare queste tabelle come tabelle preferite per BI Engine. In questo progetto devono essere eseguite solo le query che devono essere accelerate.

Riduci al minimo le unioni

BI Engine funziona al meglio con dati pre-aggregati o pre-uniti e con un numero ridotto di join. Questo accade in particolare quando un lato della congiunzione è di grandi dimensioni e gli altri sono molto più piccoli, ad esempio quando esegui una query su una tabella di fatti di grandi dimensioni unita a una tabella di dimensioni di piccole dimensioni. Puoi combinare BI Engine con le viste materializzate che eseguono join per produrre una singola tabella piatta di grandi dimensioni. In questo modo, non è necessario eseguire le stesse unioni su ogni query.

Informazioni sull'impatto di BI Engine

Per comprendere meglio in che modo i tuoi carichi di lavoro traggono vantaggio da BI Engine, puoi esaminare le statistiche di utilizzo in Cloud Monitoring o eseguire query su INFORMATION_SCHEMA in BigQuery. Assicurati di disattivare l'opzione Utilizza i risultati memorizzati nella cache in BigQuery per ottenere il confronto più accurato. Per ulteriori informazioni, consulta la sezione Utilizzare i risultati delle query memorizzati nella cache.

Quote e limitazioni

Consulta Quote e limiti di BigQuery per informazioni sulle quote e sui limiti che si applicano a BI Engine.

Prezzi

Per informazioni sui prezzi di BI Engine, consulta la pagina Prezzi di BigQuery.

Ottimizzazione e accelerazione delle query

BigQuery e di conseguenza BI Engine suddivide in sottoquery il piano di query generato per una query SQL. Una sottoquery contiene una serie di operazioni, come la scansione, l'applicazione di filtri o l'aggregazione dei dati, ed è spesso l'unità di esecuzione in uno shard.

Sebbene tutte le query SQL supportate di BigQuery vengano eseguite correttamente dall'interfaccia SQL di BI Engine, solo alcune sottoquery vengono ottimizzate. In particolare, l'interfaccia SQL di BI Engine è ottimizzata per le sottoquery a livello di entità che eseguono la scansione dei dati dall'archiviazione ed eseguono operazioni come filtro, calcolo, aggregazione, ordinamento e determinati tipi di join. Le altre sottoquery che non sono ancora completamente accelerate da BI Engine tornano a BigQuery per l'esecuzione.

Grazie a questa ottimizzazione selettiva, le query di business intelligence o di tipo dashboard più semplici traggono il massimo vantaggio da BI Engine (con un numero inferiore di sottoquery) perché la maggior parte del tempo di esecuzione viene spesa per le sottoquery a livello di entità che elaborano i dati non elaborati.

Passaggi successivi