Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Bevor Sie Funktionen mit Vertex AI Feature Store online bereitstellen können, müssen Sie die Feature-Datenquelle in BigQuery folgendermaßen einrichten:
Erstellen Sie eine BigQuery-Tabelle oder -Ansicht mit Ihren Feature-Daten. Um Feature-Daten in eine BigQuery-Tabelle oder -Ansicht zu laden, können Sie ein BigQuery-Dataset mit den Daten erstellen, eine BigQuery-Dataset erstellen und dann die Feature-Daten aus dem Dataset in die Tabelle laden.
Nachdem Sie die Feature-Daten in die BigQuery-Tabelle oder -Ansicht geladen haben, müssen Sie Vertex AI Feature Store diese Datenquelle für die Onlinebereitstellung zur Verfügung stellen. Es gibt zwei Möglichkeiten, die Datenquelle mit Onlinebereitstellungsressourcen zu verbinden, z. B. Onlinespeicher und Featureansicht-Instanzen:
Registrieren Sie die Datenquelle durch Erstellen von Feature-Gruppen und Features: Sie können Feature-Gruppen und Features mit Featureansicht-Instanzen in Ihrem Onlinespeicher verknüpfen. Sie haben folgende Möglichkeiten, die Daten zu formatieren:
Formatieren Sie Ihre Daten als Zeitreihe, indem Sie eine Feature-Zeitstempelspalte einfügen. Vertex AI Feature Store stellt nur die neuesten Featurewerte für jede eindeutige Entitäts-ID basierend auf dem Feature-Zeitstempel in dieser Spalte bereit.
Formatieren Sie die Daten ohne Spalten mit Zeitstempeln für Features.
Vertex AI Feature Store verwaltet die Zeitstempel und stellt nur die neuesten Featurewerte für jede eindeutige Entitäts-ID bereit.
Weitere Informationen zum Erstellen von Featuregruppen finden Sie unter Featuregruppe erstellen. Informationen zum Erstellen von Features innerhalb einer Featuregruppe finden Sie unter Feature erstellen.
Features direkt aus der Datenquelle bereitstellen, ohne Feature-Gruppen und Features zu erstellen:Sie können den URI der Datenquelle in der Feature-Ansicht angeben.
Beachten Sie, dass Sie die Daten in diesem Szenario nicht als Zeitreihe formatieren oder Verlaufsdaten in die BigQuery-Quelle aufnehmen können. Jede Zeile muss die neuesten Featurewerte, die einer eindeutigen ID entsprechen, enthalten. Mehrmaliges Vorkommen derselben Entitäts-ID in verschiedenen Zeilen wird nicht unterstützt.
Da Sie mit Vertex AI Feature Store Feature-Daten in BigQuery verwalten können und Features aus der BigQuery-Datenquelle bereitgestellt werden können, müssen die Features nicht in einen Offlinespeicher importiert oder kopiert werden.
Richtlinien für die Vorbereitung von Datenquellen
Befolgen Sie diese Richtlinien, um das Schema und die Einschränkungen bei der Vorbereitung der Datenquelle in BigQuery zu verstehen:
Die Datenquelle muss die folgenden Spalten enthalten:
Spalten für Entitäts-IDs: Die Datenquelle muss mindestens eine Spalte für Entitäts-IDs mit string- oder int-Werten haben. Der Standardname für diese Spalte ist entity_id. Sie können für diese Spalte auch einen anderen Namen verwenden. Die Größe jedes Werts in dieser Spalte muss kleiner als 4 KB sein.
Sie können auch einen Feature-Eintrag angeben, indem Sie die Entitäts-ID mithilfe von Features aus mehreren Spalten erstellen. In diesem Szenario können Sie mehrere Spalten mit Entitäts-IDs in die Datenquelle aufnehmen. Der Name jeder Spalte mit Entitäts-IDs muss eindeutig sein. Wenn Sie die Datenquelle durch Erstellen von Featuregruppen registrieren, legen Sie die Spalten für die Entitäts-ID für jede Featuregruppe fest.
Wenn Sie die Datenquelle dagegen direkt mit einer Feature-Ansicht verknüpfen, müssen Sie die Entitäts-ID-Spalten in den Feature-Ansichten angeben.
Sie können mehrere ID-Spalten in eine Datenquelle aufnehmen. In einem solchen Szenario muss der Name jeder Spalte mit Entitäts-ID eindeutig sein. Sie können Ihre Featuregruppen oder Featureansichten so konfigurieren, dass die Entitäts-ID anhand der Werte aus jeder Spalte für einen Feature-Datensatz erstellt wird.
Spalte für Zeitstempel des Features: Optional. Wenn Sie die Datenquelle mithilfe von Featuregruppen und Features registrieren und die Daten als Zeitreihe formatieren möchten, fügen Sie eine Spalte mit Featurezeitstempeln hinzu. Die Zeitstempelspalte enthält Werte vom Typ timestamp. Der Standardname für die Zeitstempelspalte ist feature_timestamp. Wenn Sie einen anderen Spaltennamen verwenden möchten, verwenden Sie den Parameter time_series, um die Zeitstempelspalte für die Featuregruppe festzulegen.
Wenn Sie keine Zeitstempelspalte angeben, um Ihre Daten als Zeitreihe zu formatieren, verwaltet Vertex AI Feature Store die Zeitstempel für die Features und stellt die neuesten Featurewerte bereit.
Wenn Sie eine BigQuery-Datenquelle direkt mit einer Feature-Ansicht verknüpfen, ist die Spalte „feature_timestamp“ nicht erforderlich. In diesem Szenario müssen Sie nur die neuesten Featurewerte in der Datenquelle aufnehmen und Vertex AI Feature Store ruft den Zeitstempel nicht ab.
Spalten einbetten und filtern: Optional. Wenn Sie die Verwaltung von Einbettungen in einem Onlinespeicher verwenden möchten, der für eine optimierte Onlinebereitstellung erstellt wurde, muss die Datenquelle die folgenden Spalten enthalten:
Eine embedding-Spalte mit Arrays vom Typ float.
Optional: Eine oder mehrere Filterspalten vom Typ string oder string-Array.
Optional: Eine Crowding-Spalte vom Typ int.
Jede Zeile in der Datenquelle enthält einen vollständigen Datensatz der Feature-Werte, die mit einer Entitäts-ID verknüpft sind. Wenn in einer der Spalten ein Featurewert fehlt, wird er als Nullwert betrachtet.
Jede Spalte der BigQuery-Tabelle oder -Ansicht stellt ein Feature dar.
Geben Sie die Werte für jedes Feature in einer separaten Spalte an. Wenn Sie die Datenquelle mit einer Featuregruppe und Features verknüpfen, verknüpfen Sie jede Spalte mit einem separaten Feature.
Zu den unterstützten Datentypen für die Featurewerte gehören bool, int, float,
string, timestamp, Arrays dieser Datentypen und Byte. Beachten Sie, dass während der Datensynchronisierung Featurewerte vom Typ timestamp in int64 konvertiert werden.
Die Datenquelle muss sich in derselben Region wie die Online-Instanz oder in einer Multi-Region befinden, die die Region für den Onlinespeicher enthält oder sich damit überschneidet. Wenn sich der Onlinespeicher beispielsweise in us-central befindet, kann sich die BigQuery-Quelle in us-central oder US befinden.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-19 (UTC)."],[],[],null,["# Prepare data source\n\nBefore you can start serving features online using\nVertex AI Feature Store, you need to set up your feature data source in\nBigQuery, as follows:\n\n1. Create a BigQuery table or view using your feature data. To load\n feature data into a BigQuery table or view, you can create a\n BigQuery dataset using the data, create a BigQuery\n table, and then load the feature data from the dataset into the table.\n\n2. After you load the feature data into the BigQuery table or\n view, you need to make this data source available to\n Vertex AI Feature Store for online serving. There are two ways in\n which you can connect the data source to online serving resources, such as\n online stores and feature view instances:\n\n - **Register the data source by creating feature groups and features:**\n You can associate feature groups and features with feature view instances\n in your online store. You can format the data in either of the following ways:\n\n - Format your data as a time series by including a feature timestamp\n column. Vertex AI Feature Store serves only the latest\n feature values for each unique entity ID, based on the feature\n timestamp in this column.\n\n - Format the data without including a feature timestamp columns.\n Vertex AI Feature Store manages the timestamps and serves\n only the latest feature values for each unique entity ID.\n\n For information about how to create feature groups, see\n [Create a feature group](/vertex-ai/docs/featurestore/latest/create-featuregroup). For\n information about how to create features within a feature group, see\n [create a feature](/vertex-ai/docs/featurestore/latest/create-feature).\n - **Directly serve features from the data source without creating feature groups and features:**\n You can specify the URI of the data source in the feature view.\n Note that in this scenario, you can't format your data as a time series or\n include historical data in the BigQuery source. Each row must contain\n the latest feature values corresponding to a unique ID. Multiple occurrences\n of the same entity ID in different rows are not supported.\n\nSince Vertex AI Feature Store lets you maintain feature data\nin BigQuery and serves features from the BigQuery\ndata source, there's no need to import or copy the features to an offline\nstore.\n\nData source preparation guidelines\n----------------------------------\n\nFollow these guidelines to understand the schema and constraints while preparing\nthe data source in BigQuery:\n\n1. Include the following columns in the data source:\n\n - **Entity ID columns** : The data source must have at least one entity ID\n column with `string` or `int` values. The default name for this column is\n `entity_id`. You can optionally use a different name for this column. The\n size of each value in this column must be less than 4 KB.\n\n Note that you can also designate a feature record by constructing the entity\n ID using features from multiple columns. In this scenario, you can include\n multiple entity ID columns in the data source. The name of each entity ID\n column must be unique. If you register the data source by creating feature\n groups, set the entity ID columns for each feature group.\n Otherwise, if you directly associate the data source with a feature view,\n configure the feature views to specify the entity ID columns.\n\n Note that you can include multiple ID columns in a data source. In such a\n scenario, the name of each entity ID column must be unique. You can\n configure your feature groups or feature views to construct the entity ID\n using the values from each column for a feature record.\n - **Feature timestamp column** : Optional. If you register the data source\n using feature groups and features, and need to format the data as a time\n series, include a feature timestamp column. The timestamp column contains\n values of type `timestamp`. The default name for the timestamp column is\n `feature_timestamp`. If you want to use a different column name, use the\n `time_series` parameter to set the timestamp column for the feature group.\n\n If you don't specify a timestamp column to format your data as a time series,\n Vertex AI Feature Store manages the timestamps for the features\n and serves the latest feature values.\n\n If you directly associate a BigQuery data source with a feature\n view, the `feature_timestamp` column isn't required. In this scenario, you\n must include only the latest feature values in the data source and\n Vertex AI Feature Store doesn't look up the timestamp.\n - **Embedding and filtering columns**: Optional. If you want to use embedding\n management in an online store created for Optimized online serving, the\n data source must contain the following columns:\n\n - An `embedding` column containing arrays of type `float`.\n\n - Optional: One or more filtering columns of type `string` or `string` array.\n\n - Optional: A crowding column of type `int`.\n\n2. Each row in data source is a complete record of feature values associated\n with an entity ID. If a feature value is missing in one of the columns, then\n it's considered a null value.\n\n3. Each column of the BigQuery table or view represents a feature.\n Provide the values for each feature in a separate column. If you're associating\n the data source with a feature group and features, associate each column with a separate feature.\n\n4. Supported data types for feature values include `bool`, `int`, `float`,\n `string`, `timestamp`, arrays of these data types, and bytes. Note that during\n [data sync](/vertex-ai/docs/featurestore/latest/sync-data), feature values of type `timestamp` are converted to\n `int64`.\n\n5. The data source must be located in the same region as the online store\n instance, or in a multi-region that includes or overlaps with the region for the\n online store. For example, if the online store is in `us-central`, the\n BigQuery source might be located in `us-central` or `US`.\n\n6. [Sync the data in a feature view](/vertex-ai/docs/featurestore/latest/create-featureview#sync_featuredata)\n before online serving to ensure that you serve only the latest feature values.\n If you're using scheduled data sync, you might need to [manually sync the data\n in the feature view](/vertex-ai/docs/featurestore/latest/sync-data).\n However, if you're using continuous data sync with Optimized online serving,\n then you don't need to manually sync the data.\n\nWhat's next\n-----------\n\n- Learn how to create [feature groups](/vertex-ai/docs/featurestore/latest/create-featuregroup) and [features](/vertex-ai/docs/featurestore/latest/create-feature).\n\n- Learn how to [create a feature view](/vertex-ai/docs/featurestore/latest/create-featureview).\n\n- [Online serving types](/vertex-ai/docs/featurestore/latest/online-serving-types) in Vertex AI Feature Store."]]