Pour rechercher des données cliniques dans Vertex AI Search, vous pouvez suivre l'un de ces workflows:
- Créez un data store de santé, importez des données FHIR R4 dans le data store, associez-le à une application de recherche de santé et interrogez les données cliniques.
- Créez une application de recherche pour les soins de santé, un data store de santé, puis importez des données FHIR R4 dans le data store lors du processus de création de l'application. Interrogez ensuite les données cliniques. Pour en savoir plus, consultez Créer une application de recherche de services de santé.
Cette page décrit la première méthode.
À propos de la fréquence d'importation des données
Vous pouvez importer des données FHIR R4 dans un data store de plusieurs façons:
Importation par lot: importation ponctuelle. Les données sont importées dans un data store par lot. Pour d'autres importations incrémentielles, consultez la section Actualiser les données de santé.
Importation en flux: importation de données en flux en quasi-temps réel. Toutes les modifications incrémentielles apportées au magasin FHIR source sont synchronisées dans le data store Vertex AI Search. Le streaming nécessite un connecteur de données, qui est un type de data store. Pour créer un connecteur de données, vous devez configurer une collection. Un connecteur de données contient une entité, qui est également une instance de data store.
Vous pouvez également mettre en pause et reprendre la diffusion, et effectuer une synchronisation manuelle si nécessaire. Pour en savoir plus, consultez la section Gérer un entrepôt de données de recherche dans le secteur de la santé.
Le débit de streaming de données pour un projet Google Cloud donné dépend des quotas suivants. Si vous dépassez le quota, vous risquez de rencontrer des retards de streaming.
- Nombre d'écritures en streaming FHIR ou BigQuery en attente par minute. Pour en savoir plus, consultez la page Quotas et limites.
- Nombre d'opérations de lecture FHIR par minute et par région. Pour en savoir plus, consultez la page Quotas FHIR de l'API Cloud Healthcare.
Vous pouvez sélectionner la fréquence d'importation des données au moment de la création du data store. Vous ne pourrez plus modifier cette configuration par la suite.
Avant de commencer
Avant de créer le data store de santé et d'y importer des données, vous devez comprendre les points suivants:
Relation entre les applications et les datastores pour la recherche de données de santé Pour en savoir plus, consultez la section À propos des applications et des datastores.
Vertex AI Search pour le secteur de la santé ne fournit des services de recherche que dans la multirégion des États-Unis (
us
). Par conséquent, votre application de recherche dans le secteur de la santé et vos data stores doivent se trouver dans la multirégionus
.Si vous importez des données de santé à partir d'un magasin FHIR de l'API Cloud Healthcare dans un Google Cloud projet vers un data store Vertex AI Search dans un Google Cloud projet différent et que vous utilisez VPC Service Controls, les deux projets doivent se trouver dans le même périmètre.
Créer un data store et importer vos données
Vous pouvez créer un data store et importer vos données FHIR R4 dans la consoleGoogle Cloud ou à l'aide de l'API en suivant les approches suivantes:
- Vous pouvez créer un data store statique avec une importation groupée ponctuelle. Pour en savoir plus, consultez Créer un data store statique et effectuer une importation par lot unique.
- Vous pouvez créer un data store de streaming avec des modifications de votre store FHIR associé à l'API Cloud Healthcare diffusées en continu vers votre data store Vertex AI Search. Pour en savoir plus, consultez la section Créer un data store en streaming et configurer une importation en streaming.
Créer un data store statique et effectuer une importation par lot unique
Cette section explique comment créer un data store Vertex AI Search dans lequel vous ne pouvez effectuer que des importations par lot. Vous pouvez importer des données par lot lorsque vous créez le data store pour la première fois et effectuer des importations par lot incrémentielles chaque fois que nécessaire.
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Dans le menu de navigation, cliquez sur Data Stores (Espaces de stockage de données).
Cliquez sur add_box Créer un datastore.
- Dans le volet Sélectionner une source de données, sélectionnez API Healthcare (FHIR) comme source de données.
- Pour importer des données depuis votre store FHIR, procédez comme suit :
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Développez le champ Magasin FHIR.
- Dans cette liste, sélectionnez un ensemble de données situé dans un emplacement autorisé, puis un magasin FHIR qui utilise la version R4 de FHIR.
- Saisissez le magasin FHIR manuellement :
- Développez le champ Magasin FHIR.
- Cliquez sur Saisir manuellement le magasin FHIR.
- Dans la boîte de dialogue Nom du magasin FHIR, saisissez le nom complet du magasin FHIR au format suivant:
project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
- Cliquez sur Enregistrer.
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Dans la section Synchronisation, sélectionnez l'une des options suivantes.
Une fois le data store créé, cette sélection ne peut plus être modifiée.
- Unique: pour effectuer une importation de données par lot unique. Pour d'autres importations incrémentielles, consultez Actualiser les données de santé.
- Streaming: pour effectuer une importation de données en streaming en quasi-temps réel. Pour diffuser des données, vous devez créer un connecteur de données, qui est un type de data store. Pour configurer un data store en streaming à l'aide de l'API REST, contactez votre ingénieur client.
- Dans la section Quel est le schéma de ces données ?, sélectionnez l'une des options suivantes :
- Schéma prédéfini Google: permet de conserver les configurations de schéma définies par Google, telles que l'indexabilité, la recherche et la récupération, pour les ressources et éléments FHIR compatibles. Une fois que vous avez sélectionné cette option, vous ne pouvez plus modifier le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
- Dans le champ Nom de data store datastore, saisissez un nom pour votre data store.
- Cliquez sur Créer.
Le data store que vous avez créé est listé sur la page Datastores (Datastores).
- Schéma personnalisé: permet de définir vos propres configurations de schéma, telles que l'indexabilité, la recherche et la récupération, pour les ressources et éléments FHIR compatibles. Pour configurer un schéma configurable, contactez votre ingénieur client.
- Cliquez sur Continuer.
- Examinez le schéma, développez chaque champ et modifiez les paramètres du champ.
- Cliquez sur Ajouter des champs pour ajouter des champs aux ressources FHIR compatibles. Vous ne pouvez pas supprimer les champs fournis dans le schéma défini par Google.
- Cliquez sur Continuer.
- Dans le champ Nom de votre connecteur de données, saisissez un nom pour votre connecteur de données.
- Cliquez sur Créer.
Le connecteur de données que vous avez créé est listé sur la page Datastores (Datastores). Le magasin FHIR source est ajouté en tant qu'entité dans le connecteur de données.
- Schéma prédéfini Google: permet de conserver les configurations de schéma définies par Google, telles que l'indexabilité, la recherche et la récupération, pour les ressources et éléments FHIR compatibles. Une fois que vous avez sélectionné cette option, vous ne pouvez plus modifier le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
REST
Créez un data store.
curl -X POST\ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json"\ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \ -d '{ "displayName": "DATA_STORE_DISPLAY_NAME", "industryVertical": "HEALTHCARE_FHIR", "solutionTypes": ["SOLUTION_TYPE_SEARCH"], "searchTier": "STANDARD", "searchAddOns": ["LLM"], "healthcareFhirConfig": { "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE } }'
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search que vous souhaitez créer. Cet identifiant ne peut contenir que des lettres minuscules, des chiffres, des traits de soulignement et des traits d'union.DATA_STORE_DISPLAY_NAME
: nom à afficher du data store Vertex AI Search que vous souhaitez créer.CONFIGURABLE_SCHEMA_TRUE|FALSE
: valeur booléenne qui, lorsqu'elle est définie surtrue
, vous permet de configurer le schéma du data store à l'aide de la méthodeschema.update
.
Si le magasin FHIR source et le data store Vertex AI Search cible se trouvent dans le même Google Cloud projet, appelez la méthode suivante pour effectuer une importation par lot unique. Si ce n'est pas le cas, passez à l'étape suivante.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "reconciliation_mode": "FULL", "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"} }'
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search.CLOUD_HEALTHCARE_DATASET_ID
: ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.CLOUD_HEALTHCARE_DATASET_LOCATION
: emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.FHIR_STORE_ID
: ID du magasin FHIR R4 de l'API Cloud Healthcare.
Si le datastore FHIR source et le data store Vertex AI Search cible se trouvent dans des projets Google Cloud différents, appelez la méthode suivante pour effectuer une importation par lot unique. S'ils font partie du même projet, revenez à l'étape précédente.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "reconciliation_mode": "FULL", "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"} }'
Remplacez les éléments suivants :
PROJECT_ID
: ID du Google Cloudprojet contenant le data store Vertex AI Search.DATA_STORE_ID
: ID du data store Vertex AI Search.SOURCE_PROJECT_ID
: ID du projet Google Cloudcontenant l'ensemble de données de l'API Cloud Healthcare et le magasin FHIR.CLOUD_HEALTHCARE_DATASET_ID
: ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.CLOUD_HEALTHCARE_DATASET_LOCATION
: emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.FHIR_STORE_ID
: ID du magasin FHIR R4 de l'API Cloud Healthcare.
Python
Pour en savoir plus, consultez la documentation de référence de l'API Applications d'IA Python.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Créer un datastore
Importer des documents
Étapes suivantes
- Vérifiez la création du data store et l'importation des données FHIR.
- Annuler une importation par lot en cours
- Mettez à jour le schéma de votre data store données.
Créer un data store de streaming et configurer une importation en streaming
Cette section explique comment créer un datastore de données Vertex AI Search en streaming qui diffuse en continu les modifications de votre datastore FHIR de l'API Cloud Healthcare.
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Dans le menu de navigation, cliquez sur Data Stores (Espaces de stockage de données).
Cliquez sur add_box Créer un datastore.
- Dans le volet Sélectionner une source de données, sélectionnez API Healthcare (FHIR) comme source de données.
- Pour importer des données depuis votre store FHIR, procédez comme suit :
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Développez le champ Magasin FHIR.
- Dans cette liste, sélectionnez un ensemble de données situé dans un emplacement autorisé, puis un magasin FHIR qui utilise la version R4 de FHIR.
- Saisissez le magasin FHIR manuellement :
- Développez le champ Magasin FHIR.
- Cliquez sur Saisir manuellement le magasin FHIR.
- Dans la boîte de dialogue Nom du magasin FHIR, saisissez le nom complet du magasin FHIR au format suivant:
project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
- Cliquez sur Enregistrer.
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Dans la section Synchronisation, sélectionnez l'une des options suivantes.
Une fois le data store créé, cette sélection ne peut plus être modifiée.
- Unique: pour effectuer une importation de données par lot unique. Pour d'autres importations incrémentielles, consultez Actualiser les données de santé.
- Streaming: pour effectuer une importation de données en streaming en quasi-temps réel. Pour diffuser des données, vous devez créer un connecteur de données, qui est un type de data store. Pour configurer un data store en streaming à l'aide de l'API REST, contactez votre ingénieur client.
- Dans la section Quel est le schéma de ces données ?, sélectionnez l'une des options suivantes :
- Schéma prédéfini Google: permet de conserver les configurations de schéma définies par Google, telles que l'indexabilité, la recherche et la récupération, pour les ressources et éléments FHIR compatibles. Une fois que vous avez sélectionné cette option, vous ne pouvez plus modifier le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
- Dans le champ Nom de data store datastore, saisissez un nom pour votre data store.
- Cliquez sur Créer.
Le data store que vous avez créé est listé sur la page Datastores (Datastores).
- Schéma personnalisé: permet de définir vos propres configurations de schéma, telles que l'indexabilité, la recherche et la récupération, pour les ressources et éléments FHIR compatibles. Pour configurer un schéma configurable, contactez votre ingénieur client.
- Cliquez sur Continuer.
- Examinez le schéma, développez chaque champ et modifiez les paramètres du champ.
- Cliquez sur Ajouter des champs pour ajouter des champs aux ressources FHIR compatibles. Vous ne pouvez pas supprimer les champs fournis dans le schéma défini par Google.
- Cliquez sur Continuer.
- Dans le champ Nom de votre connecteur de données, saisissez un nom pour votre connecteur de données.
- Cliquez sur Créer.
Le connecteur de données que vous avez créé est listé sur la page Datastores (Datastores). Le magasin FHIR source est ajouté en tant qu'entité dans le connecteur de données.
- Schéma prédéfini Google: permet de conserver les configurations de schéma définies par Google, telles que l'indexabilité, la recherche et la récupération, pour les ressources et éléments FHIR compatibles. Une fois que vous avez sélectionné cette option, vous ne pouvez plus modifier le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
REST
Créez un connecteur de données pour configurer le streaming.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/us:setUpDataConnector" \ -d ' { "collectionId": "COLLECTION_ID", "collectionDisplayName": "COLLECTION_NAME", "dataConnector": { "dataSource": "gcp_fhir", "params": { "instance_uri": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID" }, "entities": [ { "entityName": "FHIR_STORE_NAME" "healthcareFhirConfig": { "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE, "enableStaticIndexingForBatchIngestion": STATIC_INDEXING_TRUE|FALSE } } ], "syncMode": "STREAMING" } }'
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .COLLECTION_ID
: ID de la collection vers laquelle vous souhaitez diffuser les données FHIR R4.COLLECTION_NAME
: nom de la collection vers laquelle vous souhaitez diffuser les données FHIR R4.SOURCE_PROJECT_ID
: ID du projet Google Cloudcontenant l'ensemble de données de l'API Cloud Healthcare et le magasin FHIR.CLOUD_HEALTHCARE_DATASET_ID
: ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.CLOUD_HEALTHCARE_DATASET_LOCATION
: emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.FHIR_STORE_ID
: ID du magasin FHIR R4 de l'API Cloud Healthcare.CONFIGURABLE_SCHEMA_TRUE|FALSE
: lorsqu'il est défini surtrue
, un booléen vous permet de configurer le schéma du data store à l'aide de la méthodeschema.update
.STATIC_INDEXING_TRUE|FALSE
: valeur booléenne qui, lorsqu'elle est définie surtrue
, vous permet d'importer des données historiques avec un quota d'indexation plus élevé. Cela est utile lorsque vous prévoyez que votre application de recherche rencontrera un volume de données plus élevé. Toutefois, l'indexation des enregistrements individuels prend plus de temps. Google vous recommande vivement de définir ce champ surtrue
.
- Si la collection est créée, un connecteur de données est ajouté à la liste des datastores sur la page Datastores de la console Google Cloud .
- Le connecteur de données créé contient une entité qui porte le même nom que le magasin FHIR R4 à partir duquel vous diffusez les données.
Étapes suivantes
- Vérifiez la création du data store et l'importation des données FHIR.
- Mettez à jour le schéma de votre data store données.
- Mettre en pause ou reprendre la lecture en streaming
Vérifier la création du data store et l'importation des données FHIR
Cette tâche vous explique comment vérifier si un data store a bien été créé et si les données FHIR ont bien été importées dans le data store.
- Dans la console Google Cloud : sélectionnez le data store et vérifiez ses informations.
- Via l'API REST :
- Utilisez la méthode
dataStores.get
pour obtenir les détails du data store de santé. - Utilisez la méthode
operations.get
pour obtenir les détails de l'opération d'importation.
- Utilisez la méthode
Pour vérifier la création du data store et l'importation des données, procédez comme suit :
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Dans le menu de navigation, cliquez sur Data Stores (Espaces de stockage de données).
La page Datastores affiche la liste des datastores de votre Google Cloudprojet avec leurs détails.
Vérifiez si le data store ou le connecteur de données que vous avez créés figurent dans la liste des data stores. Dans la liste des datastores, un connecteur de données qui lit en streaming des données contient un data store portant le même nom que le datastore FHIR de l'API Cloud Healthcare.
Sélectionnez le data store ou le connecteur de données, puis vérifiez ses informations.
- Pour un data store :
- Le tableau récapitulatif contient les informations suivantes :
- ID, type et région du data store
- Nombre de documents indiquant le nombre de ressources FHIR importées.
- Code temporel du dernier document importé.
- Vous pouvez également cliquer sur Afficher les détails pour afficher les détails de l'importation de documents, comme les informations sur une importation réussie, partielle ou échouée.
- L'onglet Documents liste les ID de ressources des ressources FHIR importées et leurs types de ressources dans un tableau paginé. Vous pouvez filtrer ce tableau pour vérifier si une ressource spécifique a été importée.
- L'onglet Activité liste les détails de l'importation de documents, comme les détails d'une importation réussie, partielle ou échouée.
- Le tableau récapitulatif contient les informations suivantes :
- Pour un connecteur de données :
- Le tableau récapitulatif contient les informations suivantes :
- ID, type et région de la collection
- Nom de l'application connectée.
- État du connecteur, qui est actif ou mis en veille.
- Le tableau Entités affiche l'entité dans le connecteur de données.
Le nom de l'entité correspond au nom du magasin FHIR source. L'ID de l'entité correspond à l'ID du connecteur de données suivi du nom du magasin FHIR source.
- Cliquez sur le nom de l'entité pour voir ses détails. Étant donné qu'une entité est une instance de data store dans un connecteur de données, les informations de l'entité sont les mêmes que celles d'un data store.
- Le tableau récapitulatif contient les informations suivantes :
- Pour un data store :
Dans l'onglet Schéma, affichez les propriétés des ressources et éléments FHIR compatibles. Cliquez sur Modifier pour configurer le schéma.
REST
Vérifiez la création du data store.
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json"\ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID"
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search.
Vérifiez si l'opération d'importation des données FHIR est terminée.
curl -X GET \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID"
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search.IMPORT_OPERATION_ID
: ID de l'opération de longue durée renvoyé lorsque vous appelez la méthodeimport
Étapes suivantes
- Créez une application de recherche de données de santé et associez-y votre data store.
- Rechercher des données de santé dans votre application de recherche Healthcare
- Actualisez les données de santé.