Questa pagina mostra come iniziare a utilizzare le librerie client di Cloud per l'API Document AI Toolbox. Le librerie client semplificano l'accesso alle APIGoogle Cloud da un linguaggio supportato. Sebbene tu possa utilizzare le APIGoogle Cloud direttamente effettuando richieste non elaborate al server, le librerie client forniscono semplificazioni che riducono notevolmente la quantità di codice da scrivere.
Scopri di più sulle librerie client di Cloud e sulle librerie client delle API di Google precedenti in Spiegazione delle librerie client.
installa la libreria client
Python
pip install --upgrade google-cloud-documentai-toolbox
Per ulteriori informazioni, vedi Configurare un ambiente di sviluppo Python.
Configura l'autenticazione
Per autenticare le chiamate alle API Google Cloud , le librerie client supportano le credenziali predefinite dell'applicazione (ADC); le librerie cercano le credenziali in un insieme di posizioni definite e le utilizzano per autenticare le richieste all'API. Con ADC, puoi rendere disponibili le credenziali per la tua applicazione in una serie di ambienti, ad esempio sviluppo locale o produzione, senza dover modificare il codice dell'applicazione.Per gli ambienti di produzione, la modalità di configurazione di ADC dipende dal servizio e dal contesto. Per maggiori informazioni, vedi Configurare le credenziali predefinite dell'applicazione.
Per un ambiente di sviluppo locale, puoi configurare ADC con le credenziali associate al tuo Account Google:
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
Viene visualizzata una schermata di accesso. Dopo aver eseguito l'accesso, le tue credenziali vengono archiviate nel file delle credenziali locali utilizzato da ADC.
Utilizzare la libreria client
Document AI Toolbox è un SDK per Python che fornisce funzioni di utilità
per gestire, manipolare ed estrarre informazioni dalla risposta del documento.
Crea un oggetto documento "wrapped" da una risposta del documento elaborato dai file JSON in
Cloud Storage, dai file JSON locali o dall'output direttamente dal metodo process_document()
.
Può eseguire le seguenti azioni:
- Combina i file JSON
Document
frammentati dell'elaborazione batch in un unico documento "wrapped". - Esporta gli shard come un unico
Document
. -
Ottieni l'output
Document
da: - Accedi al testo da
Pages
,Lines
,Paragraphs
,FormFields
eTables
senza gestire le informazioniLayout
. - Cerca un
Pages
contenente una stringa di destinazione o corrispondente a un'espressione regolare. - Cerca
FormFields
per nome. - Cerca
Entities
per tipo. - Converti
Tables
in un DataFrame Pandas o in un file CSV. - Inserisci
Entities
eFormFields
in una tabella BigQuery. - Dividi un file PDF in base all'output di un processore Splitter/Classifier.
- Estrai l'immagine
Entities
daiDocument
riquadri di delimitazione. -
Converti
Documents
in e da formati di uso comune:- API Cloud Vision
AnnotateFileResponse
- hOCR
- Formati di elaborazione dei documenti di terze parti
- API Cloud Vision
- Crea batch di documenti da elaborare da una cartella Cloud Storage.
Esempi di codice
I seguenti esempi di codice mostrano come utilizzare Document AI Toolbox.
Guida rapida
Tabelle
Esportazione in BigQuery
Divisione del PDF
Estrazione immagini
Conversione della visione
Conversione hOCR
Conversione di terze parti
Batch di documenti
Unisci frammenti di documenti
Risorse aggiuntive
Python
Il seguente elenco contiene link ad altre risorse relative alla libreria client per Python: