Cette page aide les développeurs à configurer un projet Google Distributed Cloud (GDC) isolé pour utiliser le service de reconnaissance optique des caractères (OCR). Ce processus inclut la création d'un projet, l'activation de l'API OCR, l'installation de bibliothèques clientes, la définition de variables d'environnement et l'authentification de vos identifiants. Si vous ne connaissez pas Vertex AI, découvrez les fonctionnalités de reconnaissance des caractères.
Configurez un projet de reconnaissance de caractères à l'aide de la console GDC et de la CLI gdcloud comme suit :
- Console GDC : activez l'API OCR et consultez l'état du service et le point de terminaison.
- gdcloud CLI : configurez des comptes de service pour interagir avec l'API OCR, installez des bibliothèques clientes et authentifiez les requêtes d'API.
Créer un projet
La création d'un projet de reconnaissance de caractères dans votre hiérarchie de ressources Distributed Cloud permet d'organiser vos ressources OCR, qui incluent les collaborateurs, les API activées, les outils de surveillance, les informations de facturation, les identifiants d'authentification et les contrôles d'accès.
Pour créer votre projet, consultez Configurer un projet pour Vertex AI. Vous avez besoin de l'ID de votre projet pour effectuer des appels d'API.
Demander des autorisations de développeur
Vous devez disposer du rôle "Développeur AI OCR" dans votre projet pour accéder aux fonctionnalités de reconnaissance optique des caractères et générer un jeton d'API pour l'authentification et l'autorisation des requêtes.
Demandez à l'administrateur IAM de votre projet d'attribuer le rôle Développeur AI OCR (ai-ocr-developer
) à votre compte utilisateur ou de service dans l'espace de noms de votre projet. Pour en savoir plus sur ce rôle, consultez Préparer les autorisations IAM.
Activer l'API OCR
Vous devez activer l'API OCR pré-entraînée pour votre projet. Si elle est activée, vous pouvez afficher l'état du service et le point de terminaison de l'API pré-entraînée OCR.
Installer les bibliothèques clientes
Des bibliothèques clientes sont disponibles pour le langage de programmation Python. Nous vous recommandons d'utiliser ces bibliothèques clientes pour appeler l'API OCR, car elles facilitent l'accès aux API.
Installez la bibliothèque cliente OCR et suivez ces étapes pour vous assurer d'avoir la bonne version :
Vérifiez si la bibliothèque cliente OCR est installée et obtenez le numéro de version :
pip freeze | grep vision
Si la bibliothèque cliente est déjà installée, vous obtenez un résultat semblable à l'exemple suivant :
google-cloud-vision==3.0.0
Le numéro de version que vous obtenez doit correspondre à la bibliothèque cliente au point de terminaison suivant :
https://GDC_URL/.well-known/static/client-libraries
Remplacez
GDC_URL
par l'URL de votre organisation dans GDC.Si les numéros de version ne correspondent pas, désinstallez la bibliothèque cliente :
pip uninstall google-cloud-vision
Si vous avez désinstallé la bibliothèque cliente OCR, vous devez la réinstaller en spécifiant le nom de fichier correspondant à votre système d'exploitation.
Définir les variables d'environnement
Après avoir installé la bibliothèque cliente OCR, vous pouvez interagir avec l'API à partir d'un script Python.
Si vous configurez un compte de service dans votre projet pour effectuer des appels d'API autorisés de manière programmatique, vous pouvez définir des variables d'environnement dans le script Python pour accéder à des valeurs telles que les clés de compte de service lors de l'exécution.
Pour définir les variables d'environnement requises dans un script Python, procédez comme suit :
Créez un notebook JupyterLab pour interagir avec l'API OCR préentraînée.
Créez un script Python dans le notebook JupyterLab.
Ajoutez le code suivant au script Python :
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
Remplacez
APPLICATION_DEFAULT_CREDENTIALS_FILENAME
par le nom du fichier JSON contenant les clés de compte de service que vous avez créées dans le projet, par exemplemy-service-key.json
.Enregistrez le script Python sous un nom, par exemple
vision.py
.Exécutez le script Python pour définir les variables d'environnement :
python SCRIPT_NAME
Remplacez
SCRIPT_NAME
par le nom que vous avez donné à votre script Python, par exemplevision.py
.
Configurer l'authentification
Avant de pouvoir utiliser l'API OCR, vous devez authentifier vos identifiants client et demander l'accès au compte pour les ressources de votre projet. Pour en savoir plus, consultez Authentifier les requêtes API.