Modelo de datos y recursos

En las siguientes secciones se presenta el modelo de datos de Vertex AI Feature Store (antigua) y la terminología que se usa para describir los recursos y componentes de Vertex AI Feature Store (antigua).

Modelo de datos de Vertex AI Feature Store (antigua)

Vertex AI Feature Store (antigua) usa un modelo de datos de serie temporal para almacenar una serie de valores de características. Este modelo permite que Vertex AI Feature Store (antigua) mantenga los valores de las características a medida que cambian con el tiempo. Vertex AI Feature Store (antigua) organiza los recursos de forma jerárquica en el siguiente orden: Featurestore -> EntityType -> Feature. Debes crear estos recursos antes de importar datos en Vertex AI Feature Store (antigua).

Por ejemplo, supongamos que tiene los siguientes datos de origen de ejemplo de una tabla de BigQuery. Estos datos de origen se refieren a películas y sus características.

Muestra cómo se asignan los datos de origen al modelo de datos de Vertex AI Feature Store (antigua).

Antes de importar estos datos en Vertex AI Feature Store (antigua), debes crear un almacén de características, que es un contenedor de nivel superior para todos los demás recursos. En la featurestore, crea tipos de entidades que agrupen y contengan características relacionadas. A continuación, puedes crear funciones que se correspondan con las de tus datos de origen. Los nombres del tipo de entidad y de las funciones pueden reflejar los nombres de los encabezados de las columnas, pero no es obligatorio.

En este ejemplo, el encabezado de la columna movie_id se puede asignar a un tipo de entidad movie. average_rating, title y genre son características del tipo de entidad movie. Los valores de cada columna se asignan a instancias específicas de un tipo de entidad o de características, que se denominan entidades y valores de características.

La columna "Timestamp" indica cuándo se generaron los valores de las características. En el almacén de características, las marcas de tiempo son un atributo de los valores de las características, no un tipo de recurso independiente. Si todos los valores de las características se han generado al mismo tiempo, no es necesario que incluya una columna de marca de tiempo. Puedes especificar la marca de tiempo como parte de tu solicitud de importación.

Feature Store

Una featurestore es el contenedor de nivel superior de los tipos de entidades, las características y los valores de las características. Normalmente, una organización crea un almacén de características compartido para importar, servir y compartir características entre todos los equipos de la organización. Sin embargo, a veces puede que quieras crear varios almacenes de características en el mismo proyecto para aislar entornos. Por ejemplo, puede que tengas almacenes de características independientes para experimentación, pruebas y producción.

Tipo de entidad

Un tipo de entidad es un conjunto de funciones relacionadas semánticamente. Tú defines tus propios tipos de entidad en función de los conceptos que sean relevantes para tu caso práctico. Por ejemplo, un servicio de películas puede tener los tipos de entidad movie y user, que agrupan funciones relacionadas que corresponden a películas o clientes.

Entidad

Una entidad es una instancia de un tipo de entidad. Por ejemplo, movie_01 y movie_02 son entidades del tipo de entidad movie. En un almacén de características, cada entidad debe tener un ID único y ser de tipo STRING.

Función

Una característica es una propiedad o un atributo medible de un tipo de entidad. Por ejemplo, el tipo de entidad movie tiene características como average_rating y title que monitorizan varias propiedades de las películas. Las funciones están asociadas a tipos de entidad. Las funciones deben ser distintas dentro de un tipo de entidad determinado, pero no tienen por qué ser únicas a nivel mundial. Por ejemplo, si usa title para dos tipos de entidad diferentes, Vertex AI Feature Store (antigua) interpreta title como dos características diferentes. Cuando lees los valores de las características, proporcionas la característica y su tipo de entidad como parte de la solicitud.

Cuando creas una función, especificas su tipo de valor, como BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY y STRING. Este valor determina qué tipos de valores puedes importar para una función concreta. Para obtener más información sobre los tipos de valores admitidos, consulta valueType en la referencia de la API.

Valor de la característica

Vertex AI Feature Store (antigua) captura los valores de una característica en un momento concreto. Es decir, puede haber varios valores para una entidad y una función determinadas. Por ejemplo, la entidad movie_01 puede tener varios valores de la característica average_rating. El valor puede ser 4.4 en un momento dado y 4.8 en otro momento posterior. Vertex AI Feature Store (antigua) asocia una tupla de identificadores con cada valor de característica (entity_id, feature_id, timestamp), que Vertex AI Feature Store (antigua) usa para buscar valores en el momento de la publicación.

Vertex AI Feature Store (antigua) almacena valores discretos aunque el tiempo sea continuo. Cuando solicitas un valor de característica en el momento t, Vertex AI Feature Store (antigua) devuelve el último valor almacenado en el momento t o antes. Por ejemplo, si Vertex AI Feature Store (antigua) almacena la información de la ubicación de un coche en los momentos 100 y 110, la ubicación en el momento 100 se utiliza para las solicitudes en todos los momentos entre 100 (incluido) y 110 (excluido). Si necesitas una resolución más alta, puedes, por ejemplo, inferir la ubicación entre valores o aumentar la frecuencia de muestreo de tus datos.

Importación de características

La importación de funciones es el proceso de importar los valores de las funciones calculados por los trabajos de ingeniería de funciones en un almacén de funciones. Antes de importar datos, debe definir en el almacén de características el tipo de entidad y las características correspondientes. Vertex AI Feature Store (antigua) ofrece importaciones por lotes y en streaming, lo que te permite añadir valores de características de forma masiva o en tiempo real.

Por ejemplo, puede que tengas datos de origen calculados que se encuentren en ubicaciones como BigQuery o Cloud Storage. Puede importar datos por lotes de esas fuentes a un almacén de características central para que esos valores de características se puedan proporcionar en un formato uniforme. A medida que cambian los datos de origen, puedes usar la importación de streaming para incorporar rápidamente esos cambios a tu almacén de características. De esta forma, tendrás los datos más recientes disponibles para los casos de servicio online.

Para obtener más información, consulta Valores de la función de importación por lotes o Importación por streaming.

Servir características

El servicio de funciones es el proceso de exportar valores de funciones almacenados para el entrenamiento o la inferencia. Vertex AI Feature Store (antigua) ofrece dos métodos para servir características: por lotes y online. El servicio por lotes está diseñado para ofrecer un alto rendimiento y grandes volúmenes de datos para el procesamiento sin conexión (por ejemplo, para el entrenamiento de modelos o las predicciones por lotes). El servicio online se usa para recuperar datos de baja latencia de pequeños lotes de datos para el procesamiento en tiempo real (por ejemplo, para predicciones online).

Para obtener más información, consulta el servicio online o por lotes.

Vista de entidad

Cuando recuperas valores de un almacén de características, el servicio devuelve una vista de entidad que contiene los valores de las características que has solicitado. Puedes considerar una vista de entidad como una proyección de las características y los valores que Vertex AI Feature Store (antigua) devuelve de una solicitud de servicio online o por lotes:

  • En el caso de las solicitudes de servicio online, puede obtener todas las funciones de un tipo de entidad concreto o un subconjunto de ellas.
  • En las solicitudes de servicio por lotes, puedes obtener todas las funciones o un subconjunto de ellas para uno o varios tipos de entidades. Por ejemplo, si las funciones se distribuyen en varios tipos de entidades, puede recuperarlas juntas en una sola solicitud, lo que combina esas funciones. Después, puedes usar los resultados para enviarlos a una solicitud de aprendizaje automático o de predicción por lotes.

Exportar datos

Vertex AI Feature Store (antigua) te permite exportar datos de tus almacenes de características para que puedas crear copias de seguridad y archivar valores de características. Puede exportar los valores de las funciones más recientes (una instantánea) o un intervalo de valores (exportación completa). Para obtener más información, consulta Exportar valores de funciones.

Siguientes pasos