Questo documento descrive come eseguire la migrazione dalla replica dei dati in streaming alla replica CDC tramite Pub/Sub quando utilizzi BigQuery Connector per SAP.
Se sei un utente esistente di BigQuery Connector per SAP e vuoi che la tua tabella BigQuery rifletta direttamente le modifiche apportate alle tabelle SAP di origine, puoi utilizzare la replica CDC tramite Pub/Sub. Quando i dati cambiano in SAP, BigQuery Connector per SAP acquisisce le modifiche e le invia tramite Pub/Sub direttamente alla tabella BigQuery, applicando le modifiche senza duplicati.
Prima di iniziare
Prima di iniziare, scopri di più sul servizio Pub/Sub e sulla sua terminologia.
Assicurati che tu o i tuoi amministratori abbiate completato i seguenti prerequisiti:
- Aggiorna BigQuery Connector per SAP alla versione 2.9 o successive.
- Abilita le API Google Cloud .
- Configura l'autenticazione.
- Crea un argomento di messaggi non recapitabili.
Aggiornare BigQuery Connector per SAP
Per utilizzare la replica CDC tramite Pub/Sub, aggiorna BigQuery Connector per SAP alla versione 2.9 o successive. Per informazioni su come aggiornare il connettore, consulta Aggiornare BigQuery Connector per SAP.
Abilita le API Google Cloud
Per la replica CDC tramite Pub/Sub, assicurati che siano abilitate le seguenti API:
- API Pub/Sub
- API BigQuery
- API IAM Service Account Credentials
Per informazioni su come abilitare le API Google Cloud , vedi Abilitazione delle API.
Configura l'autenticazione
Per utilizzare la replica CDC tramite Pub/Sub, oltre ai ruoli BigQuery esistenti, devi concedere il ruolo Editor Pub/Sub all'account di servizio utilizzato per l'autorizzazione. Assicurati che il account di servizio abbia i seguenti ruoli:
- Editor Pub/Sub
- BigQuery Data Editor
- BigQuery Job User
Per informazioni su come concedere un ruolo, consulta Concedere un singolo ruolo.
Per informazioni sui metodi di autenticazione supportati e su come configurare l'autenticazione, vedi Configurare l'autenticazione.
Crea un argomento messaggi non recapitabili
Per gestire i messaggi che una sottoscrizione BigQuery non riesce a scrivere nella tabella BigQuery di destinazione, ti consigliamo di creare un argomento dead letter. Questo argomento messaggi non recapitabili funge da coda separata in cui Pub/Sub pubblica automaticamente i messaggi non recapitabili dopo tutti i tentativi.
Passi per la migrazione
Segui questi passaggi di migrazione di alto livello:
- Arresta la configurazione della replica di SAP LT Replication Server.
- Prepara la tabella CDC deduplicata.
- Avvia la migrazione tramite BigQuery Connector per SAP.
- Configura le impostazioni di replica.
- Attiva la configurazione della replica di SAP LT Replication Server.
- Controlla la replica in BigQuery.
Arresta la configurazione della replica di SAP LT Replication Server
Nella GUI SAP, inserisci il codice di transazione
LTRC
.Arresta la configurazione di replica di SAP LT Replication Server che vuoi migrare.
Prepara la tabella CDC deduplicata
In BigQuery, devi creare una tabella CDC deduplicata dalla tua tabella di staging BigQuery esistente. Quando utilizzi la replica CDC tramite Pub/Sub, questa tabella CDC diventa la tabella esterna in BigQuery per i tuoi dati SAP.
Per preparare una tabella CDC deduplicata:
Nella console Google Cloud , vai alla pagina BigQuery.
Fai clic su Crea nuova query.
Crea una tabella CDC dalla tabella di gestione temporanea BigQuery esistente:
Nell'area di testo dell'editor di query, per copiare la struttura della tabella di gestione temporanea BigQuery esistente, inserisci la seguente query:
CREATE TABLE CDC_TABLE LIKE STAGING_TABLE
Sostituisci quanto segue:
CDC_TABLE
: un nome per la tabella BigQuery CDC.STAGING_TABLE
: il nome della tabella di gestione temporanea BigQuery.
Fai clic su Esegui.
Questo passaggio crea una struttura della tabella CDC senza chiavi primarie.
Modifica la definizione della tabella CDC per aggiungere le chiavi primarie:
Nell'area di testo Editor di query, per aggiungere le chiavi primarie, inserisci la seguente query:
ALTER TABLE CDC_TABLE ADD PRIMARY KEY(PRIMARY_KEYS) NOT INFORCED
Sostituisci quanto segue:
CDC_TABLE
: il nome della tabella CDC.PRIMARY_KEYS
: le chiavi primarie come elenco separato da virgole. Puoi recuperare l'elenco delle chiavi primarie dalla tabella SAP di origine.
Fai clic su Esegui.
Rimuovi i duplicati dalla tabella CDC:
Nell'area di testo Editor query, per deduplicare la tabella CDC, inserisci la seguente query:
INSERT INTO CDC_TABLE (COLUMN_NAMES ) SELECT COLUMN_NAMES FROM STAGING_TABLE WHERE is_deleted = false QUALIFY ROW_NUMBER() OVER( PARTITION BY PRIMARY_KEYS ORDER BY recordstamp DESC ) = 1
Sostituisci quanto segue:
CDC_TABLE
: il nome della tabella CDC.COLUMN_NAMES
: I nomi delle colonne come elenco separato da virgole. Puoi recuperare l'elenco dei nomi delle colonne dal sistema di origine SAP. In alternativa, utilizza un asterisco (*) per selezionare tutte le colonne.PRIMARY_KEYS
: le chiavi primarie della tabella CDC.STAGING_TABLE
: il nome della tabella di gestione temporanea.
Fai clic su Esegui.
In alternativa, puoi utilizzare l'opzione Copia in BigQuery Studio per copiare la struttura della tabella di staging di origine e creare una tabella CDC.
Avvia la migrazione tramite BigQuery Connector per SAP
- Nella GUI di SAP, inserisci la transazione
/GOOG/SLT_SETTINGS
preceduta da/n
:/n/GOOG/SLT_SETTINGS
- Dal menu a discesa nel campo Partner Google Cloud, seleziona BigQuery.
- Nel menu a discesa Tabella delle impostazioni nella schermata di avvio della transazione
/GOOG/SLT_SETTINGS
, seleziona Trasferimenti collettivi. - Nel campo Mass Transfer Key (Chiave di trasferimento collettivo), specifica l'ID di trasferimento collettivo della configurazione di replica del server di replica SAP LT di cui vuoi eseguire la migrazione.
- Fai clic sull'icona Esegui.
- Nella schermata BigQuery Settings Maintenance - Mass Transfers (Manutenzione delle impostazioni di BigQuery - Trasferimenti collettivi), fai clic su Migra.
- Nella finestra di dialogo di conferma della migrazione, fai clic su Sì.
Configura le impostazioni di replica
- Nella GUI di SAP, inserisci la transazione
/GOOG/SLT_SETTINGS
preceduta da/n
:/n/GOOG/SLT_SETTINGS
- Dal menu a discesa nel campo Partner Google Cloud, seleziona BigQuery CDC tramite Pub/Sub.
- Nel menu a discesa Tabella delle impostazioni nella schermata di avvio della transazione
/GOOG/SLT_SETTINGS
, seleziona Trasferimenti collettivi. - Nel campo Chiave di trasferimento collettivo, specifica l'ID di trasferimento collettivo della configurazione di replica di SAP LT Replication Server di cui hai eseguito la migrazione nella sezione Avvia la migrazione tramite BigQuery Connector per SAP.
- Fai clic sull'icona Esegui. Viene visualizzata la schermata BigQuery Settings Maintenance - Mass Transfers.
- Verifica che venga visualizzata la configurazione della replica di SAP LT Replication Server di cui è stata eseguita la migrazione.
Per la configurazione della replica di SAP LT Replication Server, specifica i seguenti attributi della tabella:
Nel campo Nome tabella esterna, inserisci il nome della tabella CDC che hai creato nel passaggio precedente Prepara la tabella CDC deduplicata.
Per abilitare la replica CDC a BigQuery tramite Pub/Sub, seleziona la casella di controllo Repl CPS.
Nel campo Schema Pub/Sub, inserisci un nome per lo schema Pub/Sub. BigQuery Connector per SAP crea o aggiorna automaticamente uno schema Avro esistente in modo che corrisponda alla definizione della tabella SAP.
Nel campo Argomento Pub/Sub, inserisci un nome per l'argomento Pub/Sub in cui vengono pubblicati i messaggi. BigQuery Connector per SAP crea automaticamente un argomento.
Nel campo Sottoscrizione Pub/Sub, inserisci un nome per la sottoscrizione BigQuery che utilizza i messaggi dell'argomento Pub/Sub e scrive in BigQuery. BigQuery Connector per SAP crea automaticamente una sottoscrizione e la collega all'argomento specificato nel passaggio precedente.
Nel campo Coda dei messaggi non recapitabili, inserisci il nome dell'argomento Pub/Sub per i messaggi non recapitabili. Questo argomento messaggi non recapitabili riceve i messaggi che Pub/Sub non riesce a scrivere in BigQuery tramite la sottoscrizione BigQuery.
Per abilitare la funzionalità Change Data Capture (CDC) per la tabella, seleziona la casella di controllo Attiva CDC.
Per ottimizzare il rendimento dei caricamenti iniziali, seleziona la casella di controllo Cache Val (Convalida cache).
Quando selezioni questo campo, il connettore offre le massime prestazioni per i trasferimenti di grandi quantità di dati. Il sistema esegue Google Cloud convalide della pipeline a intervalli e memorizza nella cache i risultati. Il connettore fornisce una rapida trasformazione dei dati e li invia direttamente a Pub/Sub. Per ulteriori informazioni, consulta Convalide della cache.
Attiva la configurazione della replica di SAP LT Replication Server
Nella GUI SAP, inserisci il codice di transazione
LTRC
.Attiva la configurazione.
L'attivazione della configurazione crea tutte le risorse correlate a Pub/Sub e avvia la replica. La tabella CDC configurata riflette tutte le modifiche nuove e non elaborate.
Controllare la replica in BigQuery
In BigQuery, verifica che i valori nella tabella CDC siano uguali a quelli della tabella SAP di origine. Per saperne di più su come farlo, consulta Convalidare la replica in BigQuery.
Risoluzione dei problemi
Per informazioni sulla diagnosi e la risoluzione dei problemi che potresti riscontrare durante la migrazione della replica, consulta la guida alla risoluzione dei problemi di BigQuery Connector per SAP.
Assistenza
Se hai bisogno di aiuto per risolvere i problemi relativi ai passaggi di migrazione, raccogli tutte le informazioni diagnostiche disponibili e contatta l'assistenza clienti Google Cloud. Per informazioni su come contattare l'assistenza clienti, vedi Assistenza per SAP su Google Cloud.