Modello dei dati e risorse

Le sezioni seguenti introducono il modello dei dati di Vertex AI Feature Store (legacy) e la terminologia utilizzata per descrivere le risorse e i componenti di Vertex AI Feature Store (legacy).

Modello dei dati di Vertex AI Feature Store (legacy)

Vertex AI Feature Store (legacy) utilizza un modello dei dati a serie temporali per memorizzare una serie di valori per le caratteristiche. Questo modello consente a Vertex AI Feature Store (legacy) di mantenere i valori delle caratteristiche man mano che cambiano nel tempo. Vertex AI Feature Store (legacy) organizza le risorse in modo gerarchico nel seguente ordine: Featurestore -> EntityType -> Feature. Devi creare queste risorse prima di poter importare i dati in Vertex AI Feature Store (legacy).

Ad esempio, supponiamo di avere i seguenti dati di origine campione da una tabella BigQuery. Questi dati di origine riguardano film e relative caratteristiche.

Mostra come i dati di origine vengono mappati al modello dei dati di Vertex AI Feature Store (legacy)

Prima di poter importare questi dati in Vertex AI Feature Store (legacy), devi creare un featurestore, ovvero un contenitore di primo livello per tutte le altre risorse. Nel featurestore, crea tipi di entità che raggruppano e contengono caratteristiche correlate. Puoi quindi creare funzionalità che corrispondono a quelle dei dati di origine. I nomi del tipo di entità e delle funzionalità possono rispecchiare i nomi delle intestazioni delle colonne, ma non è obbligatorio.

In questo esempio, l'intestazione di colonna movie_id può mappare a un tipo di entità movie. average_rating, title e genre sono caratteristiche del tipo di entità movie. I valori di ogni colonna mappano a istanze specifiche di un tipo di entità o caratteristiche, che si chiamano entità e valori delle caratteristiche.

La colonna timestamp indica quando sono stati generati i valori delle caratteristiche. Nell'archivio di caratteristiche, i timestamp sono un attributo dei valori delle caratteristiche, non un tipo di risorsa separato. Se tutti i valori delle caratteristiche sono stati generati nello stesso momento, non è necessario avere una colonna timestamp. Il timestamp può essere specificato nell'ambito della richiesta di importazione.

Archivio di caratteristiche

Un featurestore è il container di primo livello per i tipi di entità, le caratteristiche e i valori delle caratteristiche. In genere, un'organizzazione crea un unico feature store condiviso per importare, pubblicare e condividere le funzionalità tra tutti i team dell'organizzazione. Tuttavia, a volte potresti scegliere di creare più feature store all'interno dello stesso progetto per isolare gli ambienti. Ad esempio, potresti avere feature store separati per la sperimentazione, i test e la produzione.

Tipo di entità

Un tipo di entità è una raccolta di caratteristiche semanticamente correlate. Definisci i tuoi tipi di entità in base ai concetti pertinenti al tuo caso d'uso. Ad esempio, un servizio film potrebbe avere i tipi di entità movie e user, che raggruppano le funzionalità correlate che corrispondono a film o clienti.

Entità

Un'entità è un'istanza di un tipo di entità. Ad esempio, movie_01 e movie_02 sono entità del tipo di entità movie. In un archivio di caratteristiche ogni entità deve avere un ID univoco e deve essere di tipo STRING.

Funzionalità

Una caratteristica è una proprietà o un attributo misurabile di un tipo di entità. Ad esempio, il tipo di entità movie ha caratteristiche come average_rating e title che monitorano varie proprietà dei film. Le caratteristiche sono associate ai tipi di entità. Le caratteristiche devono essere distinte all'interno di un determinato tipo di entità, ma non devono essere univoche a livello globale. Ad esempio, se utilizzi title per due diversi tipi di entità, Vertex AI Feature Store (legacy) interpreta title come due funzionalità diverse. Quando leggi i valori delle caratteristiche, fornisci la caratteristica e il relativo tipo di entità nell'ambito della richiesta.

Quando crei una caratteristica, ne specifichi il tipo di valore, ad esempio BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY e STRING. Questo determina i tipi di valore importabili per una determinata caratteristica. Per ulteriori informazioni sui tipi di valore supportati, consulta valueType nel riferimento API.

Valore della caratteristica

Vertex AI Feature Store (legacy) acquisisce i valori di una caratteristica in un momento specifico. In altre parole, è possibile avere più valori per una determinata entità e caratteristica. Ad esempio, l'entità movie_01 può avere più valori per la caratteristica average_rating. Il valore può essere 4.4 in un momento e 4.8 in un momento successivo. Vertex AI Feature Store (legacy) associa un identificatore di tupla a ogni valore della funzionalità (entity_id, feature_id, timestamp), che Vertex AI Feature Store (legacy) utilizza per cercare i valori al momento della pubblicazione.

Vertex AI Feature Store (legacy) memorizza valori discreti anche se il tempo è continuo. Quando richiedi un valore della caratteristica al momento t, Vertex AI Feature Store (legacy) restituisce l'ultimo valore memorizzato al momento t o prima. Ad esempio, se Vertex AI Feature Store (legacy) memorizza le informazioni sulla posizione di un'auto negli orari 100 e 110, la posizione all'ora 100 viene utilizzata per le richieste in tutti gli orari tra 100 (incluso) e 110 (escluso). Se hai bisogno di una risoluzione più elevata, puoi, ad esempio, dedurre la posizione tra i valori o aumentare la frequenza di campionamento dei dati.

Importazione delle funzionalità

L'importazione delle caratteristiche è il processo di importazione dei valori delle caratteristiche calcolati dai job di feature engineering in un archivio di caratteristiche. Prima di poter importare i dati, il tipo di entità e le caratteristiche corrispondenti devono essere definiti nell'archivio di caratteristiche. Vertex AI Feature Store (legacy) offre l'importazione batch e in streaming, consentendoti di aggiungere valori delle caratteristiche in blocco o in tempo reale.

Ad esempio, potresti avere dati di origine calcolati che si trovano in posizioni come BigQuery o Cloud Storage. Puoi importare in batch i dati da queste origini in un archivio di caratteristiche centrale, in modo che i valori delle caratteristiche possano essere pubblicati in un formato uniforme. Man mano che i dati di origine cambiano, puoi utilizzare l'importazione in streaming per incorporare rapidamente queste modifiche nel feature store. In questo modo, avrai a disposizione i dati più recenti per gli scenari di pubblicazione online.

Per ulteriori informazioni, consulta Importazione in batch dei valori delle caratteristiche o Importazione di flussi di dati.

Distribuzione delle caratteristiche

La distribuzione delle caratteristiche è il processo di esportazione dei valori delle caratteristiche memorizzati per l'addestramento o l'inferenza. Vertex AI Feature Store (legacy) offre due metodi per la distribuzione delle caratteristiche: batch e online. Il recupero dati in batch è quello che si usa per un'elevata velocità effettiva e per esportare grandi volumi di dati per l'elaborazione offline (ad esempio l'addestramento di modelli o le previsioni in batch). La distribuzione online si usa per il recupero a bassa latenza di piccoli batch di dati per l'elaborazione in tempo reale (come per le previsioni online).

Per ulteriori informazioni, consulta la sezione online o batch.

Vista entità

Quando recuperi i valori da un archivio di caratteristiche, il servizio restituisce una vista entità che contiene i valori delle caratteristiche richieste. Puoi pensare a una vista entità come a una proiezione delle caratteristiche e dei valori che Vertex AI Feature Store (legacy) restituisce da una richiesta di recupero dati in batch oppure online:

  • Per le richieste di distribuzione online, è possibile ottenere tutte o un sottoinsieme di caratteristiche per un particolare tipo di entità.
  • Per le richieste di recupero dati in batch, è possibile ottenere tutte o un sottoinsieme di caratteristiche per uno o più tipi di entità. Ad esempio, se le caratteristiche sono distribuite su più tipi di entità, puoi recuperarle insieme in un'unica richiesta, che le unisce. Puoi quindi utilizzare i risultati per inviarli a una richiesta di previsione in batch o di machine learning.

Esporta i dati

Vertex AI Feature Store (legacy) consente di esportare i dati dai feature store in modo da poter eseguire il backup e l'archiviazione dei valori delle caratteristiche. Puoi scegliere di esportare i valori delle caratteristiche più recenti (snapshot) o un intervallo di valori (esportazione completa). Per ulteriori informazioni, vedi Esportare i valori delle caratteristiche.

Passaggi successivi