Membangun dan men-deploy model AI generatif dan machine learning di perusahaan

Karena model AI generatif dan machine learning (ML) menjadi lebih umum dalam aktivitas bisnis dan proses bisnis perusahaan, perusahaan semakin membutuhkan panduan tentang pengembangan model untuk memastikan konsistensi, keterulangan, keamanan, dan keamanan. Untuk membantu perusahaan besar membangun dan men-deploy model AI dan ML generatif, kami telah membuat blueprint machine learning dan AI generatif perusahaan. Blueprint ini memberikan panduan komprehensif untuk seluruh siklus proses pengembangan AI, mulai dari eksplorasi data awal dan eksperimentasi hingga pelatihan model, deployment, dan pemantauan.

Blueprint AI generatif dan ML perusahaan memberi Anda banyak manfaat, termasuk:

  • Panduan preskriptif: Panduan yang jelas tentang cara membuat, mengonfigurasi, dan men-deploy lingkungan pengembangan AI generatif dan ML yang didasarkan pada Vertex AI. Anda dapat menggunakan Vertex AI untuk mengembangkan model Anda sendiri.
  • Peningkatan efisiensi: Otomatisasi ekstensif untuk membantu mengurangi toil dari men-deploy infrastruktur dan mengembangkan model ML dan AI generatif. Otomatisasi memungkinkan Anda berfokus pada tugas bernilai tambah seperti desain model dan eksperimentasi.
  • Tata kelola dan kemampuan audit yang lebih baik: Reproduksi, keterlacakan, dan deployment model yang terkontrol dimasukkan ke dalam desain blueprint ini. Manfaat ini memungkinkan Anda mengelola siklus proses model ML dan AI generatif dengan lebih baik serta membantu memastikan Anda dapat melatih ulang dan mengevaluasi model secara konsisten, dengan jejak audit yang jelas.
  • Keamanan: Blueprint dirancang agar selaras dengan persyaratan framework National Institute of Standards and Technology (NIST) dan framework Cyber Risk Institute (CRI).

Blueprint AI generatif dan ML perusahaan mencakup hal-hal berikut:

  • Repositori GitHub yang berisi serangkaian konfigurasi Terraform, Jupyter notebook, definisi Vertex AI Pipelines, Cloud Composer grafik asiklik terarah (DAG), dan skrip tambahan. Komponen dalam repositori menyelesaikan hal berikut:
    • Konfigurasi Terraform menyiapkan platform pengembangan model Vertex AI yang dapat mendukung beberapa tim pengembangan model.
    • {i>Notebook<i} Jupyter memungkinkan Anda mengembangkan model secara interaktif.
    • Definisi Vertex AI Pipelines menerjemahkan notebook Jupyter menjadi pola yang dapat direproduksi dan dapat digunakan untuk lingkungan produksi.
    • DAG Cloud Composer menyediakan metode alternatif untuk Vertex AI Pipelines.
    • Skrip tambahan membantu men-deploy pipeline dan kode Terraform.
  • Panduan arsitektur, desain, kontrol keamanan, dan proses operasional yang harus diimplementasikan dengan menggunakan blueprint ini (dokumen ini).

Blueprint AI generatif dan ML perusahaan dirancang agar kompatibel dengan blueprint fondasi perusahaan. Blueprint enterprise foundation menyediakan sejumlah layanan tingkat dasar yang diperlukan oleh blueprint ini, seperti jaringan VPC. Anda dapat men-deploy blueprint AI generatif dan ML perusahaan tanpa men-deploy blueprint fondasi perusahaan jika Google Cloud lingkungan Anda menyediakan fungsi yang diperlukan untuk mendukung blueprint ML dan AI generatif perusahaan.

Dokumen ini ditujukan bagi arsitek cloud, data scientist, dan data engineer yang dapat menggunakan blueprint untuk membangun dan men-deploy model AI generatif atau ML baru di Google Cloud. Dokumen ini mengasumsikan bahwa Anda telah memahami pengembangan model ML dan AI generatif serta platform machine learning Vertex AI.

Untuk ringkasan prinsip dan rekomendasi arsitektur yang khusus untuk beban kerja AI dan ML di Google Cloud, lihat perspektif AI dan ML dalam Framework dengan Arsitektur yang Baik.

Ringkasan blueprint AI generatif dan ML perusahaan

Blueprint AI generatif dan ML perusahaan menggunakan pendekatan berlapis untuk memberikan kemampuan yang memungkinkan pelatihan model ML dan AI generatif. Cetak biru ini dimaksudkan untuk di-deploy dan dikontrol melalui alur kerja operasi ML (MLOps). Diagram berikut menunjukkan hubungan antara lapisan MLOps yang di-deploy oleh blueprint ini dengan lapisan lain di lingkungan Anda.

Lapisan cetak biru.

Diagram ini mencakup hal berikut:

  • Google Cloud Infrastruktur memberi Anda kemampuan keamanan seperti enkripsi dalam penyimpanan dan enkripsi dalam pengiriman, serta elemen penyusun dasar seperti komputasi dan penyimpanan.
  • Fondasi perusahaan menyediakan dasar pengukuran resource seperti sistem identitas, jaringan, logging, pemantauan, dan deployment yang dapat Anda gunakan untuk mengadopsi Google Cloud workload AI Anda.
  • Lapisan data adalah lapisan opsional dalam development stack yang memberi Anda berbagai kemampuan, seperti penyerapan data, penyimpanan data, kontrol akses data, tata kelola data, pemantauan data, dan berbagi data.
  • Lapisan AI generatif dan ML (blueprint ini) memungkinkan Anda membangun dan men-deploy model. Anda dapat menggunakan lapisan ini untuk eksplorasi dan eksperimen data awal, pelatihan model, inferensi model, dan pemantauan.
  • CI/CD menyediakan alat untuk mengotomatiskan penyediaan, konfigurasi, pengelolaan, dan deployment infrastruktur, alur kerja, dan komponen software. Komponen-komponen ini membantu Anda memastikan deployment yang konsisten, andal, dan dapat diaudit; meminimalkan error manual; dan mempercepat siklus pengembangan secara keseluruhan.

Untuk menunjukkan cara penggunaan lingkungan ML dan AI generatif, blueprint ini mencakup sampel pengembangan model ML. Contoh pengembangan model akan memandu Anda membangun model, membuat pipeline operasional, melatih model, menguji model, dan men-deploy model.

Arsitektur

Blueprint AI generatif dan ML perusahaan memberi Anda kemampuan untuk bekerja langsung dengan data. Anda dapat membuat model di lingkungan interaktif (pengembangan) dan mempromosikan model ke dalam lingkungan operasional (produksi atau non-produksi).

Di lingkungan interaktif, Anda mengembangkan model ML menggunakan Vertex AI Workbench, yang merupakan layanan Notebook Jupyter yang dikelola oleh Google. Anda akan membangun kemampuan ekstraksi data, transformasi data, dan penyesuaian model di lingkungan interaktif, serta mempromosikannya ke lingkungan operasional.

Dalam lingkungan operasional (non-produksi), Anda menggunakan pipeline untuk membangun dan menguji modelnya dengan cara yang dapat diulang dan dikontrol. Setelah puas dengan performa model, Anda dapat men-deploy model ke dalam lingkungan operasional (produksi). Diagram berikut menunjukkan berbagai komponen lingkungan interaktif dan operasional.

Arsitektur blueprint.

Diagram ini mencakup hal berikut:

  1. Sistem deployment: Layanan seperti resource Katalog Layanan dan Cloud Build men-deploy Google Cloud ke lingkungan interaktif. Cloud Build juga men-deploy Google Cloud resource dan alur kerja pembangunan model ke lingkungan operasional.
  2. Sumber data: Layanan seperti BigQuery, Cloud Storage, Spanner, dan AlloyDB untuk PostgreSQL menghosting data Anda. Blueprint menyediakan contoh data di BigQuery dan Cloud Storage.
  3. Lingkungan interaktif: Lingkungan tempat Anda dapat berinteraksi langsung dengan data, bereksperimen pada model, dan membangun pipeline untuk digunakan di lingkungan operasional.
  4. Lingkungan operasional: Lingkungan tempat Anda dapat membangun dan menguji model secara berulang, lalu men-deploy model ke dalam produksi.
  5. Layanan model: Layanan berikut mendukung berbagai aktivitas MLOps:
  6. Penyimpanan artefak: Layanan ini menyimpan kode dan container, serta untuk pengembangan dan pipeline model Anda. Layanan ini mencakup:
    • Artifact Registry menyimpan container yang digunakan oleh pipeline di lingkungan operasional untuk mengontrol berbagai tahap pengembangan model.
    • Repositori Git menyimpan code base berbagai komponen yang digunakan dalam pengembangan model.

Persona platform

Saat men-deploy blueprint, Anda membuat empat jenis grup pengguna: grup engineer MLOps, grup engineer DevOps, grup data scientist, dan grup data engineer. Grup tersebut memiliki tanggung jawab berikut:

  • Grup MLOps engineer mengembangkan template Terraform yang digunakan oleh Katalog Layanan. Tim ini menyediakan template yang digunakan oleh banyak model.
  • Grup DevOps engineer menyetujui template Terraform yang dibuat oleh grup developer MLOps.
  • Grup data scientist mengembangkan model, pipeline, dan container yang digunakan oleh pipeline. Biasanya, satu tim didedikasikan untuk membangun satu model.
  • Grup Data engineer menyetujui penggunaan artefak yang dibuat oleh grup data science.

Struktur organisasi

Blueprint ini menggunakan struktur organisasi blueprint yayasan perusahaan sebagai dasar untuk men-deploy workload AI dan ML. Diagram berikut menunjukkan project yang ditambahkan ke fondasi untuk mengaktifkan workload AI dan ML.

Struktur organisasi cetak biru.

Tabel berikut menjelaskan project yang digunakan oleh blueprint AI generatif dan ML.

Folder Project Deskripsi

common

prj-c-infra-pipeline

Berisi pipeline deployment yang digunakan untuk membangun komponen AI generatif dan ML dari blueprint. Untuk mengetahui informasi selengkapnya, lihat pipeline infrastruktur dalam blueprint fondasi perusahaan.

prj-c-service-catalog

Berisi infrastruktur yang digunakan oleh Katalog Layanan untuk men-deploy resource di lingkungan interaktif.

development

prj-d-machine-learning

Berisi komponen untuk mengembangkan kasus penggunaan AI dan ML dalam mode interaktif.

non-production

prj-n-machine-learning

Berisi komponen untuk menguji dan mengevaluasi kasus penggunaan AI dan ML yang dapat di-deploy ke produksi.

production

prj-p-machine-learning

Berisi komponen untuk men-deploy kasus penggunaan AI dan ML ke dalam produksi.

Jaringan

Blueprint ini menggunakan Jaringan VPC Bersama yang dibuat dalam blueprint dasar perusahaan. Di lingkungan interaktif (pengembangan), notebook Vertex AI Workbench di-deploy dalam project layanan. Pengguna lokal dapat mengakses project menggunakan ruang alamat IP pribadi di Jaringan VPC Bersama. Pengguna lokal dapat mengakses Google Cloud API, seperti Cloud Storage, melalui Private Service Connect. Setiap jaringan VPC Bersama (pengembangan, non-produksi, dan produksi) memiliki endpoint Private Service Connect yang berbeda.

Jaringan blueprint.

Lingkungan operasional (non-produksi dan produksi) memiliki dua jaringan VPC Bersama terpisah yang dapat diakses oleh resource lokal melalui alamat IP pribadi. Lingkungan interaktif dan operasional dilindungi menggunakan Kontrol Layanan VPC.

Cloud Logging

Blueprint ini menggunakan kemampuan Cloud Logging yang disediakan oleh blueprint dasar perusahaan.

Cloud Monitoring

Untuk memantau tugas pelatihan kustom, blueprint ini menyertakan dasbor yang memungkinkan Anda memantau metrik berikut:

  • Pemakaian CPU setiap node pelatihan
  • Penggunaan memori setiap node pelatihan
  • Penggunaan jaringan

Jika tugas pelatihan kustom gagal, blueprint akan menggunakan Cloud Monitoring untuk memberi Anda mekanisme pemberitahuan email untuk memberi tahu Anda tentang kegagalan tersebut. Untuk memantau model yang di-deploy dan menggunakan endpoint Vertex AI, blueprint dilengkapi dengan dasbor yang memiliki metrik berikut:

  • Metrik performa:
    • Prediksi per detik
    • Latensi model
  • Penggunaan resource:
    • Penggunaan CPU
    • Penggunaan memori

Penyiapan kebijakan organisasi

Selain kebijakan organisasi yang dibuat oleh blueprint dasar perusahaan, blueprint ini menambahkan kebijakan organisasi yang tercantum dalam postur standar untuk AI aman, diperluas.

Operasi

Bagian ini menjelaskan lingkungan yang disertakan dalam blueprint.

Lingkungan interaktif

Agar Anda dapat mempelajari data dan mengembangkan model sekaligus mempertahankan postur keamanan organisasi, lingkungan interaktif memberi Anda serangkaian tindakan terkontrol yang dapat Anda lakukan. Anda dapat men-deploy resource Google Cloud menggunakan salah satu metode berikut:

  • Menggunakan Katalog Layanan, yang telah dikonfigurasi sebelumnya melalui otomatisasi dengan template resource
  • Membangun artefak kode dan menyimpannya ke repositori Git menggunakan notebook Vertex AI Workbench

Diagram berikut menggambarkan lingkungan interaktif.

Lingkungan interaktif blueprint.

Alur interaktif standar memiliki langkah dan komponen berikut yang terkait dengannya:

  1. Katalog Layanan menyediakan daftar resource Google Cloud pilihan yang dapat di-deploy oleh data scientist ke dalam lingkungan interaktif. Data scientist men-deploy resource notebook Vertex AI Workbench dari Katalog Layanan.
  2. Notebook Vertex AI Workbench adalah antarmuka utama yang digunakan data scientist untuk bekerja dengan Google Cloud resource yang di-deploy di lingkungan interaktif. Notebook ini memungkinkan ilmuwan data mengambil kode dari Git dan memperbarui kodenya sesuai kebutuhan.
  3. Data sumber disimpan di luar lingkungan interaktif dan dikelola secara terpisah dari blueprint ini. Akses ke data dikontrol oleh pemilik data. Data scientist dapat meminta akses baca ke data sumber, tetapi data scientist tidak dapat menulis ke data sumber.
  4. Data scientist dapat mentransfer data sumber ke lingkungan interaktif ke resource yang dibuat melalui Katalog Layanan. Di lingkungan interaktif, ilmuwan data dapat membaca, menulis, dan memanipulasi data. Namun, data scientist tidak dapat mentransfer data keluar dari lingkungan interaktif atau memberikan akses ke resource yang dibuat oleh Katalog Layanan. BigQuery menyimpan data terstruktur dan data semi-terstruktur, sedangkan Cloud Storage menyimpan data tak terstruktur.
  5. Feature Store memberi data scientist akses berlatensi rendah ke fitur untuk pelatihan model.
  6. Data scientist melatih model menggunakan tugas pelatihan kustom Vertex AI. Blueprint ini juga menggunakan Vertex AI untuk penyesuaian hyperparameter.

  7. Data scientist mengevaluasi model melalui penggunaan Vertex AI Experiment dan Vertex AI TensorBoard. Eksperimen Vertex AI memungkinkan Anda menjalankan beberapa pelatihan terhadap model menggunakan parameter, teknik pemodelan, arsitektur, dan input yang berbeda. Dengan Vertex AI TensorBoard, Anda dapat melacak, memvisualisasikan, dan membandingkan berbagai eksperimen yang Anda jalankan, lalu memilih model dengan karakteristik terbaik yang diamati untuk divalidasi.

  8. Data scientist memvalidasi model mereka dengan evaluasi Vertex AI. Untuk memvalidasi modelnya, data scientist membagi data sumber menjadi set data pelatihan dan set data validasi, lalu menjalankan evaluasi Vertex AI terhadap model Anda.

  9. Data scientist membangun container menggunakan Cloud Build, menyimpan container di Artifact Registry, dan menggunakan container tersebut di pipeline yang berada di lingkungan operasional.

Lingkungan operasional

Lingkungan operasional menggunakan pipeline dan repositori Git. Lingkungan ini mencakup lingkungan produksi dan lingkungan non-produksi dari blueprint dasar perusahaan. Dalam lingkungan non-produksi, data scientist memilih pipeline dari salah satu pipeline yang dikembangkan di lingkungan interaktif. Data scientist dapat menjalankan pipeline di lingkungan non-produksi, mengevaluasi hasilnya, lalu menentukan model mana yang akan dipromosikan ke dalam lingkungan produksi.

Blueprint ini mencakup contoh pipeline yang dibangun menggunakan Cloud Composer dan contoh pipeline yang dibuat menggunakan Vertex AI Pipelines. Diagram di bawah menunjukkan lingkungan operasional.

Lingkungan operasional blueprint.

Alur operasional umum memiliki langkah-langkah berikut:

  1. Seorang data scientist berhasil menggabungkan cabang pengembangan ke dalam cabang deployment.
  2. Penggabungan ke cabang deployment akan memicu pipeline Cloud Build.
  3. Salah satu item berikut terjadi:
    • Jika data scientist menggunakan Cloud Composer sebagai orkestrator, pipeline Cloud Build memindahkan DAG ke Cloud Storage.
    • Jika data scientist menggunakan Vertex AI Pipelines sebagai orkestrasi, pipeline akan memindahkan file Python ke Cloud Storage.
  4. Pipeline Cloud Build memicu orkestrator (Cloud Composer atau Vertex AI Pipelines).
  5. Orkestrator mengambil definisi pipeline-nya dari Cloud Storage dan mulai mengeksekusi pipeline.
  6. Pipeline mengambil container dari Artifact Registry yang digunakan oleh semua tahap pipeline untuk memicu layanan Vertex AI.
  7. Pipeline, menggunakan penampung, memicu transfer data dari project data sumber ke lingkungan operasional.
  8. Data ditransformasi, divalidasi, dibagi, dan disiapkan untuk pelatihan model dan validasi oleh pipeline.
  9. Jika diperlukan, pipeline akan memindahkan data ke Vertex AI Feature Store untuk memudahkan akses selama pelatihan model.
  10. Pipeline ini menggunakan pelatihan model kustom Vertex AI untuk melatih model.
  11. Pipeline menggunakan evaluasi Vertex AI untuk memvalidasi model.
  12. Model yang divalidasi akan diimpor ke dalam Model Registry oleh pipeline.
  13. Model yang diimpor kemudian digunakan untuk menghasilkan prediksi melalui prediksi online atau prediksi batch.
  14. Setelah model di-deploy ke lingkungan produksi, pipeline akan menggunakan Pemantauan Model Vertex AI untuk mendeteksi apakah performa model menurun dengan memantau distorsi penyaluran pelatihan dan penyimpangan prediksi.

Deployment

Blueprint ini menggunakan serangkaian pipeline Cloud Build untuk menyediakan infrastruktur blueprint, pipeline di lingkungan operasional, dan container yang digunakan untuk membuat model AI generatif dan ML. Pipeline yang digunakan dan resource yang disediakan adalah sebagai berikut:

  • Pipeline infrastruktur: Pipeline ini adalah bagian dari blueprint dasar perusahaan. Pipeline ini menyediakan Google Cloud resource yang dikaitkan dengan lingkungan interaktif dan lingkungan operasional.
  • Pipeline interaktif: Pipeline interaktif adalah bagian dari lingkungan interaktif. Pipeline ini menyalin template Terraform dari repositori Git ke bucket Cloud Storage yang dapat dibaca Katalog Layanan. Pipeline interaktif terpicu saat permintaan pull dibuat untuk digabungkan dengan cabang utama.
  • Pipeline container: Blueprint mencakup pipeline Cloud Build untuk membangun container yang digunakan dalam pipeline operasional. Container yang di-deploy di seluruh lingkungan adalah image container yang tidak dapat diubah. Image container yang tidak dapat diubah membantu memastikan bahwa image yang sama di-deploy di semua lingkungan dan tidak dapat diubah saat dijalankan. Jika perlu mengubah aplikasi, Anda harus membangun ulang dan men-deploy ulang image. Image container yang digunakan dalam blueprint disimpan di Artifact Registry dan dirujuk oleh file konfigurasi yang digunakan dalam pipeline operasional.
  • Pipeline operasional: Pipeline operasional adalah bagian dari lingkungan operasional. Pipeline ini menyalin DAG untuk Cloud Composer atau Vertex AI Pipelines, yang kemudian digunakan untuk membuat, menguji, dan men-deploy model.

Katalog Layanan

Dengan Katalog Layanan, developer dan administrator cloud dapat membuat solusi mereka dapat digunakan oleh pengguna internal perusahaan. Modul Terraform di Katalog Layanan dibangun dan dipublikasikan sebagai artefak di bucket Cloud Storage dengan pipeline CI/CD Cloud Build. Setelah modul disalin ke bucket, developer dapat menggunakan modul tersebut untuk membuat solusi Terraform di halaman Admin Katalog Layanan, menambahkan solusi ke Katalog Layanan, dan membagikan solusi ke project lingkungan interaktif sehingga pengguna dapat men-deploy resource.

Lingkungan interaktif menggunakan Katalog Layanan agar data scientist dapat men-deploy Google Cloud resource dengan cara yang sesuai dengan postur keamanan perusahaan mereka. Saat mengembangkan model yang memerlukanGoogle Cloud resource, seperti bucket Cloud Storage, ilmuwan data memilih resource dari Katalog Layanan, mengonfigurasi resource, dan men-deploy resource di lingkungan interaktif. Katalog Layanan berisi template yang telah dikonfigurasi sebelumnya untuk berbagai Google Cloud resource yang dapat di-deploy oleh data scientist di lingkungan interaktif. Data scientist tidak dapat mengubah template resource, tetapi dapat mengonfigurasi resource melalui variabel konfigurasi yang diekspos oleh template. Diagram berikut menunjukkan struktur hubungan antara Katalog Layanan dan lingkungan interaktif.

Katalog blueprint.

Data scientist men-deploy resource menggunakan Katalog Layanan, seperti yang dijelaskan dalam langkah-langkah berikut:

  1. Engineer MLOps menempatkan template resource Terraform untukGoogle Cloud ke dalam repositori Git.
  2. Commit untuk Git akan memicu pipeline Cloud Build.
  3. Cloud Build menyalin template dan file konfigurasi terkait ke Cloud Storage.
  4. Engineer MLOps menyiapkan solusi Katalog Layanan dan Katalog Layanan secara manual. Engineer kemudian membagikan Katalog Layanan ke project layanan di lingkungan interaktif.
  5. Data scientist memilih resource dari Katalog Layanan.
  6. Katalog Layanan men-deploy template ke lingkungan interaktif.
  7. Resource ini menarik semua skrip konfigurasi yang diperlukan.
  8. Data scientist berinteraksi dengan resource.

Repositori

Pipeline yang dijelaskan dalam Deployment dipicu oleh perubahan di repositorinya yang sesuai. Untuk membantu memastikan bahwa tidak ada yang dapat membuat perubahan independen pada lingkungan produksi, terdapat pemisahan tanggung jawab antara pengguna yang dapat mengirimkan kode dan pengguna yang dapat menyetujui perubahan kode. Tabel berikut menjelaskan repositori blueprint beserta pengirim dan pemberi persetujuannya.

Repositori Pipeline Deskripsi Pengirim Pemberi Persetujuan

ml-foundation

Infrastruktur
Berisi kode Terraform untuk blueprint AI generatif dan ML yang menciptakan lingkungan interaktif dan operasional. Engineer MLOps DevOps engineer

service-catalog

Interaktif Berisi template untuk resource yang dapat di-deploy oleh Katalog Layanan. Engineer MLOps DevOps engineer

artifact-publish

Container Berisi kontainer yang dapat digunakan oleh pipeline di lingkungan operasional. Ilmuwan data Data engineer

machine-learning

Operasional Berisi kode sumber yang dapat digunakan pipeline di lingkungan operasional. Ilmuwan data Data engineer

Strategi cabang

Blueprint menggunakan percabangan persisten untuk men-deploy kode ke lingkungan terkait. Blueprint ini menggunakan tiga cabang (pengembangan, non-produksi, dan produksi) yang mencerminkan lingkungan yang terkait.

Kontrol keamanan

Blueprint AI generatif dan ML perusahaan menggunakan model keamanan defense in depth berlapis yang menggunakan kemampuan Google Cloud , Google Cloud layanan, dan kemampuan keamanan default yang dikonfigurasi melalui blueprint dasar perusahaan. Diagram berikut menunjukkan lapisan berbagai kontrol keamanan untuk blueprint.

Kontrol keamanan blueprint.

Fungsi lapisan adalah sebagai berikut:

  • Antarmuka: menyediakan layanan kepada data scientist yang memungkinkan mereka berinteraksi dengan blueprint secara terkontrol.
  • Deployment: menyediakan serangkaian pipeline yang men-deploy infrastruktur, membangun container, dan membuat model. Penggunaan pipeline memungkinkan kemampuan audit, keterlacakan, dan kemampuan pengulangan.
  • Jaringan: memberikan perlindungan pemindahan data yang tidak sah di sekitar resource cetak biru di lapisan API dan lapisan IP.
  • Pengelolaan akses: mengontrol siapa saja yang dapat mengakses resource tertentu dan membantu mencegah penggunaan resource Anda tanpa izin.
  • Enkripsi: memungkinkan Anda mengontrol kunci dan rahasia enkripsi Anda, serta membantu melindungi data Anda melalui enkripsi dalam penyimpanan dan enkripsi dalam pengiriman default.
  • Detektif: membantu Anda mendeteksi kesalahan konfigurasi dan aktivitas berbahaya.
  • Pencegahan: memberi Anda sarana untuk mengontrol dan membatasi cara infrastruktur Anda di-deploy.

Tabel berikut menjelaskan kontrol keamanan yang terkait dengan setiap lapisan.

Lapisan. Resource Kontrol keamanan
Antarmuka Vertex AI Workbench Memberikan pengalaman notebook terkelola yang menggabungkan kontrol akses pengguna, kontrol akses jaringan, kontrol akses IAM, dan download file yang dinonaktifkan. Fitur-fitur ini memungkinkan pengalaman pengguna yang lebih aman.
Repositori Git Menyediakan kontrol akses pengguna untuk melindungi repositori Anda.
Katalog Layanan Memberikan daftar resource pilihan kepada data scientist yang hanya dapat di-deploy dalam konfigurasi yang disetujui.
Deployment Pipeline infrastruktur Memberikan alur yang aman untuk men-deploy infrastruktur blueprint melalui penggunaan Terraform.
Pipeline interaktif Menyediakan alur yang aman untuk mentransfer template dari repositori Git ke dalam bucket dalam Google Cloud organisasi Anda.
Pipeline container Memberikan alur yang aman untuk membangun container yang digunakan oleh pipeline operasional.
Pipeline operasional Memberikan alur terkontrol untuk melatih, menguji, memvalidasi, dan men-deploy model.
Artifact Registry Menyimpan image container secara aman menggunakan kontrol akses resource
Jaringan Private Service Connect Memungkinkan Anda berkomunikasi dengan Google Cloud API menggunakan alamat IP pribadi sehingga Anda dapat menghindari paparan traffic ke internet.
VPC dengan alamat IP pribadi Blueprint ini menggunakan VPC dengan alamat IP pribadi untuk membantu menghapus eksposur terhadap ancaman yang dihadapi internet.
Kontrol Layanan VPC Membantu melindungi resource yang dilindungi dari pemindahan data yang tidak sah.
Firewall Membantu melindungi jaringan VPC dari akses yang tidak sah.
Pengelolaan Akses Cloud Identity Menyediakan pengelolaan pengguna terpusat, sehingga mengurangi risiko akses tanpa izin.
IAM Memberikan kontrol terperinci terkait siapa yang dapat melakukan tindakan tertentu ke resource tertentu, sehingga memungkinkan hak istimewa terendah dalam pengelolaan akses.
Enkripsi Cloud KMS Memungkinkan Anda mengontrol kunci enkripsi yang digunakan dalam Google Cloud organisasi.
Secret Manager Menyediakan penyimpanan rahasia untuk model Anda yang dikontrol oleh IAM.
Enkripsi dalam penyimpanan Secara default, Google Cloud mengenkripsi data dalam penyimpanan.
Enkripsi dalam pengiriman Secara default, Google Cloud mengenkripsi data dalam pengiriman.
Detektif Security Command Center Menyediakan detektor ancaman yang membantu melindungi Google Cloud organisasi Anda.
Arsitektur berkelanjutan Teruslah memeriksa Google Cloud organisasi Anda berdasarkan serangkaian kebijakan Open Policy Agent (OPA) yang telah Anda tetapkan.
Pemberi Rekomendasi IAM Menganalisis izin pengguna dan memberikan saran terkait pengurangan izin untuk membantu menerapkan prinsip hak istimewa terendah.
Analisis Firewall Menganalisis aturan firewall, mengidentifikasi aturan firewall yang terlalu permisif, dan menyarankan firewall yang lebih ketat untuk membantu memperkuat postur keamanan Anda secara keseluruhan.
Cloud Logging Memberikan visibilitas terhadap aktivitas sistem dan membantu memungkinkan deteksi anomali dan aktivitas berbahaya.
Cloud Monitoring Melacak sinyal dan peristiwa utama yang dapat membantu mengidentifikasi aktivitas yang mencurigakan.
Pencegahan Organization Policy Service Memungkinkan Anda membatasi tindakan dalam Google Cloud organisasi.

Langkah berikutnya