Fungsi ML.QUANTILE_BUCKETIZE

Dokumen ini menjelaskan fungsi ML.QUANTILE_BUCKETIZE, yang memungkinkan Anda membagi suatu fitur numerik berkelanjutan ke dalam bucket-bucket berdasarkan kuantil.

Saat digunakan dalam klausa TRANSFORM, kuantil-kuantil yang sama akan otomatis digunakan dalam prediksi.

Sintaksis

ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()

Argumen

ML.QUANTILE_BUCKETIZE menggunakan argumen berikut:

  • numerical_expression: ekspresi numerik yang akan dikelompokkan.
  • num_buckets: nilai INT64 yang menentukan jumlah bucket untuk membagi numerical_expression.

Output

ML.QUANTILE_BUCKETIZE menampilkan nilai STRING yang berisi nama bucket. Nama bucket yang ditampilkan memiliki format bin_<bucket_index>, dengan bucket_index dimulai dari 1.

Contoh

Contoh berikut membagi suatu ekspresi numerik dari lima elemen ke dalam tiga bucket:

SELECT
  f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket
FROM
  UNNEST([1,2,3,4,5]) AS f;

Outputnya terlihat mirip dengan yang berikut ini:

+---+--------+
| f | bucket |
+---+--------+
| 3 | bin_2  |
| 5 | bin_3  |
| 2 | bin_2  |
| 1 | bin_1  |
| 4 | bin_3  |
+---+--------+

Langkah selanjutnya