Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Sebelum dapat mulai menyalurkan fitur secara online menggunakan
Vertex AI Feature Store, Anda perlu menyiapkan sumber data fitur di
BigQuery, sebagai berikut:
Buat tabel atau tampilan BigQuery menggunakan data fitur Anda. Untuk memuat
data fitur ke dalam tabel atau tampilan BigQuery, Anda dapat membuat
set data BigQuery menggunakan data tersebut, membuat tabel
BigQuery, lalu memuat data fitur dari set data ke dalam tabel tersebut.
Setelah memuat data fitur ke dalam tabel atau
tampilan BigQuery, Anda harus menyediakan sumber data ini untuk
Vertex AI Feature Store agar dapat disalukan secara online. Ada dua cara
untuk menghubungkan sumber data ke resource penyaluran online, seperti
toko online dan instance tampilan fitur:
Daftarkan sumber data dengan membuat grup fitur dan fitur:
Anda dapat mengaitkan grup fitur dan fitur dengan instance tampilan fitur
di toko online Anda. Anda dapat memformat data dengan salah satu cara berikut:
Format data Anda sebagai deret waktu dengan menyertakan kolom stempel waktu
fitur. Vertex AI Feature Store hanya menyalurkan nilai fitur terbaru
untuk setiap ID entity unik, berdasarkan stempel waktu
fitur di kolom ini.
Format data tanpa menyertakan kolom stempel waktu fitur.
Vertex AI Feature Store mengelola stempel waktu dan hanya menyalurkan
nilai fitur terbaru untuk setiap ID entity unik.
Untuk mengetahui informasi tentang cara membuat grup fitur, lihat
Membuat grup fitur. Untuk
mengetahui informasi cara membuat fitur dalam grup fitur, lihat
membuat fitur.
Menyalurkan fitur secara langsung dari sumber data tanpa membuat grup fitur dan fitur:
Anda dapat menentukan URI sumber data dalam tampilan fitur.
Perhatikan bahwa dalam skenario ini, Anda tidak dapat memformat data sebagai deret waktu atau
menyertakan data historis dalam sumber BigQuery. Setiap baris harus berisi
nilai fitur terbaru yang sesuai dengan ID unik. Beberapa kemunculan
ID entity yang sama di baris yang berbeda tidak didukung.
Karena Vertex AI Feature Store memungkinkan Anda mengelola data fitur
di BigQuery dan menyalurkan fitur dari sumber data
BigQuery, maka Anda tidak perlu mengimpor atau menyalin fitur ke toko
offline.
Panduan persiapan sumber data
Ikuti panduan ini untuk memahami skema dan batasan saat menyiapkan
sumber data di BigQuery:
Sertakan kolom berikut di sumber data:
Kolom ID entity: Sumber data harus memiliki minimal satu kolom ID entity
dengan nilai string atau int. Nama default untuk kolom ini adalah
entity_id. Secara opsional, Anda dapat menggunakan nama lain untuk kolom ini. Ukuran
setiap nilai dalam kolom ini harus kurang dari 4 KB.
Perhatikan bahwa Anda juga dapat menetapkan data fitur dengan membuat ID entity menggunakan fitur dari beberapa kolom. Dalam skenario ini, Anda dapat menyertakan
beberapa kolom ID entity dalam sumber data. Nama setiap kolom ID entity
harus unik. Jika Anda mendaftarkan sumber data dengan membuat grup fitur, tetapkan kolom ID entity untuk setiap grup fitur.
Atau, jika Anda langsung mengaitkan sumber data dengan tampilan fitur, konfigurasikan tampilan fitur untuk menentukan kolom ID entity.
Perhatikan bahwa Anda dapat menyertakan beberapa kolom ID dalam sumber data. Dalam skenario
tersebut, nama setiap kolom ID entity harus unik. Anda dapat mengonfigurasi grup fitur atau tampilan fitur untuk membuat ID entity menggunakan nilai dari setiap kolom untuk kumpulan data fitur.
Kolom stempel waktu fitur: Opsional. Jika Anda mendaftarkan sumber data menggunakan grup fitur dan fitur, dan perlu memformat data sebagai deret waktu, sertakan kolom stempel waktu fitur. Kolom stempel waktu berisi
nilai jenis timestamp. Nama default untuk kolom stempel waktu adalah
feature_timestamp. Jika Anda ingin menggunakan nama kolom yang berbeda, gunakan parameter time_series untuk menetapkan kolom stempel waktu untuk grup fitur.
Jika Anda tidak menentukan kolom stempel waktu untuk memformat data sebagai deret waktu,
Vertex AI Feature Store akan mengelola stempel waktu untuk fitur
dan menyalurkan nilai fitur terbaru.
Jika Anda langsung mengaitkan sumber data BigQuery dengan tampilan fitur, kolom feature_timestamp tidak diperlukan. Dalam skenario ini, Anda
hanya boleh menyertakan nilai fitur terbaru dalam sumber data dan
Vertex AI Feature Store tidak akan mencari stempel waktu.
Menyemat dan memfilter kolom: Opsional. Jika Anda ingin menggunakan pengelolaan
penyematan di toko online yang dibuat untuk Penyaluran online yang dioptimalkan, sumber data harus berisi kolom berikut:
Kolom embedding yang berisi array jenis float.
Opsional: Satu atau beberapa kolom pemfilteran dari jenis string atau array string.
Opsional: Kolom kepadatan jenis int.
Setiap baris dalam sumber data adalah catatan lengkap nilai fitur yang terkait
dengan ID entity. Jika nilai fitur tidak ada di salah satu kolom,
nilai tersebut dianggap sebagai nilai null.
Setiap kolom dalam tabel atau tampilan BigQuery mewakili sebuah fitur.
Masukkan nilai untuk setiap fitur di kolom terpisah. Jika Anda mengaitkan
sumber data dengan grup fitur dan fitur, kaitkan setiap kolom dengan fitur terpisah.
Jenis data yang didukung untuk nilai fitur mencakup bool, int, float,
string, timestamp, array jenis data ini, dan byte. Perhatikan bahwa selama
sinkronisasi data, nilai fitur jenis timestamp akan dikonversi menjadi
int64.
Sumber data harus berada di region yang sama dengan instance toko online,
atau di multi-region yang mencakup atau tumpang-tindih dengan region untuk
toko online. Misalnya, jika toko online berada di us-central,
sumber BigQuery mungkin berada di us-central atau US.
Sinkronkan data dalam tampilan fitur
sebelum penyaluran online untuk memastikan Anda hanya menyalurkan nilai fitur terbaru.
Jika menggunakan sinkronisasi data terjadwal, Anda mungkin perlu menyinkronkan data secara manual di tampilan fitur.
Namun, jika menggunakan sinkronisasi data berkelanjutan dengan Penayangan online yang dioptimalkan,
Anda tidak perlu menyinkronkan data secara manual.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-19 UTC."],[],[],null,["# Prepare data source\n\nBefore you can start serving features online using\nVertex AI Feature Store, you need to set up your feature data source in\nBigQuery, as follows:\n\n1. Create a BigQuery table or view using your feature data. To load\n feature data into a BigQuery table or view, you can create a\n BigQuery dataset using the data, create a BigQuery\n table, and then load the feature data from the dataset into the table.\n\n2. After you load the feature data into the BigQuery table or\n view, you need to make this data source available to\n Vertex AI Feature Store for online serving. There are two ways in\n which you can connect the data source to online serving resources, such as\n online stores and feature view instances:\n\n - **Register the data source by creating feature groups and features:**\n You can associate feature groups and features with feature view instances\n in your online store. You can format the data in either of the following ways:\n\n - Format your data as a time series by including a feature timestamp\n column. Vertex AI Feature Store serves only the latest\n feature values for each unique entity ID, based on the feature\n timestamp in this column.\n\n - Format the data without including a feature timestamp columns.\n Vertex AI Feature Store manages the timestamps and serves\n only the latest feature values for each unique entity ID.\n\n For information about how to create feature groups, see\n [Create a feature group](/vertex-ai/docs/featurestore/latest/create-featuregroup). For\n information about how to create features within a feature group, see\n [create a feature](/vertex-ai/docs/featurestore/latest/create-feature).\n - **Directly serve features from the data source without creating feature groups and features:**\n You can specify the URI of the data source in the feature view.\n Note that in this scenario, you can't format your data as a time series or\n include historical data in the BigQuery source. Each row must contain\n the latest feature values corresponding to a unique ID. Multiple occurrences\n of the same entity ID in different rows are not supported.\n\nSince Vertex AI Feature Store lets you maintain feature data\nin BigQuery and serves features from the BigQuery\ndata source, there's no need to import or copy the features to an offline\nstore.\n\nData source preparation guidelines\n----------------------------------\n\nFollow these guidelines to understand the schema and constraints while preparing\nthe data source in BigQuery:\n\n1. Include the following columns in the data source:\n\n - **Entity ID columns** : The data source must have at least one entity ID\n column with `string` or `int` values. The default name for this column is\n `entity_id`. You can optionally use a different name for this column. The\n size of each value in this column must be less than 4 KB.\n\n Note that you can also designate a feature record by constructing the entity\n ID using features from multiple columns. In this scenario, you can include\n multiple entity ID columns in the data source. The name of each entity ID\n column must be unique. If you register the data source by creating feature\n groups, set the entity ID columns for each feature group.\n Otherwise, if you directly associate the data source with a feature view,\n configure the feature views to specify the entity ID columns.\n\n Note that you can include multiple ID columns in a data source. In such a\n scenario, the name of each entity ID column must be unique. You can\n configure your feature groups or feature views to construct the entity ID\n using the values from each column for a feature record.\n - **Feature timestamp column** : Optional. If you register the data source\n using feature groups and features, and need to format the data as a time\n series, include a feature timestamp column. The timestamp column contains\n values of type `timestamp`. The default name for the timestamp column is\n `feature_timestamp`. If you want to use a different column name, use the\n `time_series` parameter to set the timestamp column for the feature group.\n\n If you don't specify a timestamp column to format your data as a time series,\n Vertex AI Feature Store manages the timestamps for the features\n and serves the latest feature values.\n\n If you directly associate a BigQuery data source with a feature\n view, the `feature_timestamp` column isn't required. In this scenario, you\n must include only the latest feature values in the data source and\n Vertex AI Feature Store doesn't look up the timestamp.\n - **Embedding and filtering columns**: Optional. If you want to use embedding\n management in an online store created for Optimized online serving, the\n data source must contain the following columns:\n\n - An `embedding` column containing arrays of type `float`.\n\n - Optional: One or more filtering columns of type `string` or `string` array.\n\n - Optional: A crowding column of type `int`.\n\n2. Each row in data source is a complete record of feature values associated\n with an entity ID. If a feature value is missing in one of the columns, then\n it's considered a null value.\n\n3. Each column of the BigQuery table or view represents a feature.\n Provide the values for each feature in a separate column. If you're associating\n the data source with a feature group and features, associate each column with a separate feature.\n\n4. Supported data types for feature values include `bool`, `int`, `float`,\n `string`, `timestamp`, arrays of these data types, and bytes. Note that during\n [data sync](/vertex-ai/docs/featurestore/latest/sync-data), feature values of type `timestamp` are converted to\n `int64`.\n\n5. The data source must be located in the same region as the online store\n instance, or in a multi-region that includes or overlaps with the region for the\n online store. For example, if the online store is in `us-central`, the\n BigQuery source might be located in `us-central` or `US`.\n\n6. [Sync the data in a feature view](/vertex-ai/docs/featurestore/latest/create-featureview#sync_featuredata)\n before online serving to ensure that you serve only the latest feature values.\n If you're using scheduled data sync, you might need to [manually sync the data\n in the feature view](/vertex-ai/docs/featurestore/latest/sync-data).\n However, if you're using continuous data sync with Optimized online serving,\n then you don't need to manually sync the data.\n\nWhat's next\n-----------\n\n- Learn how to create [feature groups](/vertex-ai/docs/featurestore/latest/create-featuregroup) and [features](/vertex-ai/docs/featurestore/latest/create-feature).\n\n- Learn how to [create a feature view](/vertex-ai/docs/featurestore/latest/create-featureview).\n\n- [Online serving types](/vertex-ai/docs/featurestore/latest/online-serving-types) in Vertex AI Feature Store."]]