Créer une caractéristique

Vous pouvez créer une caractéristique après avoir créé un groupe de caractéristiques et lui avoir associé une table ou une vue BigQuery. Vous pouvez créer plusieurs caractéristiques pour un groupe de caractéristiques et associer chaque caractéristique à une colonne spécifique de la source de données BigQuery. Pour en savoir plus sur l'utilisation de BigQuery, reportez-vous à la documentation de BigQuery.

Par exemple, si le groupe de caractéristiques featuregroup1 est associé à la table BigQuery datasource_1 contenant des valeurs de caractéristiques dans des colonnes fval1 et fval2, vous pouvez créer une caractéristiquefeature_1 sous featuregroup1 et l'associer aux valeurs des caractéristiques dans la colonnefval1. De même, vous pouvez créer une autre caractéristique nommée feature_2 et l'associer aux valeurs de caractéristiques de la colonne fval2.

L'enregistrement de votre source de données à l'aide de groupes de caractéristiques et de caractéristiques présente les avantages suivants :

  • Vous pouvez définir une vue de caractéristiques pour la livraison en ligne à l'aide de colonnes de caractéristiques spécifiques provenant de plusieurs sources de données BigQuery.

  • Vous pouvez mettre en forme vos données en tant que séries temporelles en incluant la colonne feature_timestamp. Vertex AI Feature Store ne diffuse que les dernières valeurs de caractéristiques à partir des données de caractéristiques et exclut les valeurs historiques.

  • Vous pouvez découvrir la source BigQuery en tant que source de données de caractéristique associée lorsque vous recherchez la ressource de caractéristiques dans Data Catalog.

Avant de commencer

Authentifiez-vous auprès de Vertex AI, sauf si vous l'avez déjà fait.

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

Python

Pour utiliser les exemples Python de cette page dans un environnement de développement local, installez et initialisez gcloud CLI, puis configurez le service Identifiants par défaut de l'application à l'aide de vos identifiants utilisateur.

  1. Install the Google Cloud CLI.
  2. To initialize the gcloud CLI, run the following command:

    gcloud init
  3. If you're using a local shell, then create local authentication credentials for your user account:

    gcloud auth application-default login

    You don't need to do this if you're using Cloud Shell.

Pour en savoir plus, consultez Set up authentication for a local development environment.

REST

Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à gcloud CLI.

    Install the Google Cloud CLI, then initialize it by running the following command:

    gcloud init

Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud.

Créer une caractéristique dans un groupe de caractéristiques

Utilisez les exemples suivants pour créer une caractéristique dans un groupe de caractéristiques et associer une colonne contenant des valeurs de caractéristiques à partir de la source de données BigQuery enregistrée pour le groupe de caractéristiques.

Console

Suivez les instructions ci-dessous pour ajouter des caractéristiques à un groupe de caractéristiques existant à l'aide de la console Google Cloud.

  1. Dans la section "Vertex AI" de la console Google Cloud, accédez à la page Feature Store.

    Accéder à la page Feature Store

  2. Dans la section Groupes de caractéristiques, cliquez sur sur la ligne correspondant au groupe de caractéristiques auquel vous souhaitez ajouter une caractéristique, puis cliquez sur Ajouter des caractéristiques.

  3. Pour chaque caractéristique, saisissez un nom de caractéristique, puis cliquez sur le nom de la colonne source BigQuery correspondante dans la liste. Pour ajouter des caractéristiques, cliquez sur Ajouter une autre caractéristique.

  4. Cliquez sur Créer.

Python

Pour savoir comment installer ou mettre à jour le SDK Vertex AI pour Python, consultez la section Installer le SDK Vertex AI pour Python. Pour en savoir plus, consultez la documentation de référence de l'API Python.


from google.cloud import aiplatform
from vertexai.resources.preview import feature_store


def create_feature_sample(
    project: str,
    location: str,
    existing_feature_group_id: str,
    feature_id: str,
    version_column_name: str,
):
    aiplatform.init(project=project, location=location)
    feature_group = feature_store.FeatureGroup(existing_feature_group_id)
    feature = feature_group.create_feature(
        name=feature_id, version_column_name=version_column_name
    )
    return feature

  • project : ID de votre projet
  • location : région où se trouve le groupe de caractéristiques, par exemple us-central1.
  • existing_feature_group_id : nom du groupe de caractéristiques existant dans lequel vous souhaitez créer la caractéristique.
  • version_column_name Facultatif : colonne de la table ou de la vue BigQuery que vous souhaitez associer à la caractéristique. Si vous ne spécifiez pas ce paramètre, il est défini par défaut sur FEATURE_NAME.
  • feature_id : nom de la nouvelle caractéristique que vous souhaitez créer.

REST

Pour créer une ressource Feature, envoyez une requête POST à l'aide de la méthode features.create.

Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :

  • LOCATION_ID : région où se trouve le groupe de caractéristiques, par exemple us-central1.
  • PROJECT_ID : ID de votre projet
  • FEATUREGROUP_NAME : nom du groupe de caractéristiques dans lequel vous souhaitez créer la caractéristique.
  • FEATURE_NAME : nom de la nouvelle caractéristique que vous souhaitez créer.
  • VERSION_COLUMN_NAME Facultatif : colonne de la table ou de la vue BigQuery que vous souhaitez associer à la caractéristique. Si vous ne spécifiez pas ce paramètre, il est défini par défaut sur FEATURE_NAME.

Méthode HTTP et URL :

POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/features?feature_id=FEATURE_NAME

Corps JSON de la requête :

{
  "version_column_name": "VERSION_COLUMN_NAME"
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/features?feature_id=FEATURE_NAME"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/features?feature_id=FEATURE_NAME" | Select-Object -Expand Content

Vous devriez recevoir une réponse JSON de ce type :

{
  "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/features/FEATURE_NAME/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureOperationMetadata",
    "genericMetadata": {
      "createTime": "2023-09-18T02:36:22.870679Z",
      "updateTime": "2023-09-18T02:36:22.870679Z"
    }
  }
}

Étapes suivantes