Model Garden adalah library model AI/ML yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model serta aset dari Google dan partner Google.
Keunggulan Model Garden
Saat Anda bekerja dengan model AI, Model Garden memberikan keuntungan sebagai berikut:
- Semua model yang tersedia dikelompokkan di satu lokasi
- Model Garden menyediakan pola deployment yang konsisten untuk berbagai jenis model
- Model Garden menyediakan integrasi bawaan dengan bagian lain dari Vertex AI seperti penyesuaian, evaluasi, dan penayangan model
- Menyajikan model AI generatif bisa jadi sulit—Vertex AI menangani deployment dan penyajian model untuk Anda
Mempelajari model
Untuk melihat daftar model dasar, model yang dapat disesuaikan, dan model khusus tugas Vertex AI dan open source yang tersedia, buka halaman Model Garden di konsolGoogle Cloud .
Kategori model yang tersedia di Model Garden adalah:
Kategori | Deskripsi |
---|---|
Model dasar | Model besar multitugas terlatih yang dapat dimodifikasi atau disesuaikan untuk tugas tertentu menggunakan Vertex AI Studio, Vertex AI API, dan Vertex AI SDK untuk Python. |
Model yang dapat disesuaikan | Model yang dapat Anda sesuaikan menggunakan notebook atau pipeline kustom. |
Solusi khusus tugas | Sebagian besar model bawaan ini siap digunakan. Banyak di antaranya yang dapat disesuaikan menggunakan data Anda sendiri. |
Untuk memfilter model di panel filter, tentukan hal berikut:
- Tasks: Klik tugas yang Anda inginkan untuk dijalankan model.
- Koleksi model: Klik untuk memilih model yang dikelola oleh Google, partner, atau Anda.
- Penyedia: Klik penyedia model.
- Fitur: Klik fitur yang Anda inginkan dalam model.
Untuk mempelajari lebih lanjut setiap model, klik kartu modelnya.
Untuk mengetahui daftar model yang tersedia di Model Garden, lihat Model yang tersedia di Model Garden.
Pemindaian keamanan model
Google melakukan pengujian dan tolok ukur menyeluruh pada penayangan dan penyesuaian container yang kami sediakan. Pemindaian kerentanan aktif juga diterapkan pada artefak container.
Model pihak ketiga dari partner unggulan menjalani pemindaian checkpoint model untuk memastikan keasliannya. Model pihak ketiga dari HuggingFace Hub dipindai langsung oleh HuggingFace dan pemindai pihak ketiga mereka untuk mendeteksi malware, file pickle, lapisan Keras Lambda, dan rahasia. Model yang dianggap tidak aman dari pemindaian ini ditandai oleh HuggingFace dan diblokir dari deployment di Model Garden. Model yang dianggap mencurigakan atau yang berpotensi menjalankan kode jarak jauh ditandai di Model Garden, tetapi masih dapat di-deploy. Sebaiknya Anda melakukan peninjauan menyeluruh terhadap model yang mencurigakan sebelum men-deploy-nya dalam Model Garden.
Harga
Untuk model open source di Model Garden, Anda akan dikenai biaya untuk penggunaan berikut di Vertex AI:
- Penyesuaian model: Anda akan ditagih untuk resource komputasi yang digunakan dengan tarif yang sama seperti pelatihan kustom. Lihat harga pelatihan kustom.
- Deployment model: Anda ditagih untuk resource komputasi yang digunakan untuk men-deploy model ke endpoint. Lihat harga prediksi.
- Colab Enterprise: Lihat Harga Colab Enterprise.
Mengontrol akses ke model tertentu
Anda dapat menetapkan kebijakan organisasi Model Garden di tingkat organisasi, folder, atau project untuk mengontrol akses ke model tertentu di Model Garden. Misalnya, Anda dapat mengizinkan akses ke model tertentu yang telah Anda periksa dan menolak akses ke semua model lainnya.
Mempelajari Model Garden lebih lanjut
Untuk mengetahui informasi selengkapnya tentang opsi deployment dan penyesuaian yang dapat Anda lakukan dengan model di Model Garden, lihat referensi di bagian berikut, yang mencakup link ke tutorial, referensi, notebook, dan video YouTube.
Men-deploy dan menayangkan
Pelajari lebih lanjut cara menyesuaikan deployment dan fitur penayangan lanjutan.
- Men-deploy dan menayangkan model open source menggunakan Python SDK, CLI, REST API, atau konsol
- Men-deploy dan menyetel Gemma 3 di video YouTube Model Garden
- Men-deploy Gemma dan membuat prediksi
- Menayangkan model terbuka dengan container Hex-LLM di TPU Cloud
- Men-deploy model Llama menggunakan notebook tutorial Hex-LLM
- Menggunakan caching awalan dan decoding spekulatif dengan notebook tutorial Hex-LLM atau vLLM
- Menggunakan vLLM untuk menyajikan model bahasa multimodel dan khusus teks di GPU Cloud
- Menggunakan container penyaluran GPU xDiT untuk pembuatan gambar dan video
- Menayangkan Gemma 2 dengan beberapa adaptor LoRA menggunakan tutorial inferensi HuggingFace DLC untuk PyTorch di Medium
- Menggunakan nama saluran kustom untuk menayangkan PaliGemma untuk pembuatan teks gambar dengan tutorial inferensi HuggingFace DLC untuk PyTorch di LinkedIn
- Men-deploy dan menyajikan model yang menggunakan Spot VM atau tutorial notebook reservasi Compute Engine
- Men-deploy dan menyajikan model HuggingFace
Kepatuhan container
Model Garden menawarkan container yang sesuai dengan FedRAMP High berikut untuk penayangan model.
Nama penampung | Tugas yang didukung | Versi image container | Contoh notebook |
---|---|---|---|
Inferensi PyTorch v0.1 | audio2text text2image zero-shot-image-classification zero-shot-object-detection csm_text2speech dia_text2speech image-to-text visual-question-answering instant-id janus_text2image janus_text_generation mask-generation nllb_translation paligemma_v2 pix2pix |
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/pytorch-inference.cu125.0-1.ubuntu2204.py310:model-garden.pytorch-inference-0-1-gpu-release_20250727.00_p0 Catatan: kerentanan CVE-2024-12797 yang terdeteksi dianggap sebagai positif palsu dalam container. |
Whisper Large V3 (Deployment) |
Inferensi PyTorch v0.4 | audio2text text2image zero-shot-image-classification zero-shot-object-detection csm_text2speech dia_text2speech image-to-text visual-question-answering instant-id janus_text2image janus_text_generation mask-generation nllb_translation paligemma_v2 pix2pix |
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/pytorch-inference.cu125.0-4.ubuntu2204.py310:model-garden.pytorch-inference-0-4-gpu-release_20250725.00_p0 Catatan: kerentanan CVE-2024-12797 yang terdeteksi dianggap sebagai positif palsu dalam container. |
HiDream-I1 |
SGLang | Pembuatan text2text | us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/sglang-serve.cu124.0-4.ubuntu2204.py310:model-garden.sglang-0-4-release_20250718.00_p0 Catatan: kerentanan CVE-2024-12797 yang terdeteksi dianggap sebagai positif palsu dalam penampung. |
Qwen3 (Deployment) |
HuggingFace Inference Toolkit | Pembuatan text2image pembuatan teks standar klasifikasi teks terjemahan deteksi objek zero-shot pembuatan mask penyematan kalimat ekstraksi fitur pengisian mask Daftar tugas lengkap: https://huggingface.co/docs/inference-endpoints/en/supported_tasks |
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/hf-inference-toolkit.cu125.0-1.ubuntu2204.py311:model-garden.hf-inference-toolkit-0-1-release_20250726.00_p0 | Deployment Inferensi PyTorch Hugging Face |
Inferensi Embedding Teks (TEI) HuggingFace | text2embeddings | us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/hf-tei.cu125.0-1.ubuntu2204.py310:model-garden.hf-tei-0-1-release_20250727.00_p0 Catatan: kerentanan CVE-2024-12797 yang terdeteksi dianggap sebagai positif palsu dalam container. |
Deployment Inferensi Embedding Teks Hugging Face |
Penyesuaian
Pelajari lebih lanjut cara menyesuaikan model untuk menyesuaikan respons untuk kasus penggunaan tertentu.
- Notebook tutorial fine-tuning Workbench
- Notebook tutorial penyesuaian dan evaluasi
- Men-deploy dan menyetel Gemma 3 di video YouTube Model Garden
Evaluasi
Mempelajari lebih lanjut cara menilai respons model dengan Vertex AI
Referensi lainnya
- Notebook Model Garden khusus model dan perjalanan pengguna
- Notebook penayangan, penyesuaian, dan evaluasi model terbuka Vertex AI