Panduan ini memperkenalkan konsep inti AI generatif dan alur kerja untuk membangun aplikasi di Vertex AI, yang mencakup topik berikut:
Panduan pemula ini memperkenalkan Anda pada teknologi inti AI generatif dan menjelaskan cara teknologi tersebut bekerja sama untuk mendukung chatbot dan aplikasi.
AI generatif (juga dikenal sebagai genAI atau gen AI) adalah bidang machine learning (ML) yang mengembangkan dan menggunakan model ML untuk menghasilkan konten baru. Model AI generatif sering disebut model bahasa besar (LLM) karena
ukurannya yang besar serta kemampuannya untuk memahami dan menghasilkan bahasa alami.
Namun, bergantung pada data yang digunakan untuk melatih model, model ini dapat memahami dan menghasilkan konten dari berbagai modalitas, termasuk teks, gambar, video, dan audio. Model yang berfungsi dengan beberapa modalitas data disebut model multimodal. Google menyediakan rangkaian model AI generatif Gemini yang dirancang untuk kasus penggunaan multimodal; mampu memproses informasi dari berbagai modalitas, termasuk gambar, video, dan teks. Agar model AI generatif dapat menghasilkan konten yang berguna dalam aplikasi dunia nyata, model tersebut harus memiliki kemampuan berikut: Diagram berikut merangkum alur kerja keseluruhan: Alur kerja AI generatif biasanya dimulai dengan prompt. Perintah adalah permintaan bahasa alami yang dikirim ke model AI generatif untuk mendapatkan respons. Bergantung pada modelnya, perintah dapat berisi teks, gambar, video, audio, dokumen, atau beberapa modalitas (multimodal). Misalnya, perintah teks sederhana dapat berupa: Membuat perintah untuk mendapatkan respons yang diinginkan dari model adalah praktik yang disebut desain perintah. Meskipun desain prompt merupakan proses uji coba, ada prinsip dan strategi desain prompt yang dapat Anda gunakan untuk mendorong model agar berperilaku dengan cara yang diinginkan. Vertex AI Studio menawarkan alat pengelolaan perintah untuk membantu Anda mengelola perintah. Perintah dikirim ke model AI generatif untuk pembuatan respons. Vertex AI memiliki berbagai model dasar AI generatif yang dapat diakses melalui API terkelola. Model tersebut memiliki ukuran, modalitas, dan biaya yang berbeda. Tabel berikut memberikan ringkasan umum: Anda dapat menjelajahi model Google, serta model terbuka dan model dari partner Google, di Model Garden. Anda dapat menyesuaikan perilaku default model dasar Google agar dapat secara konsisten memberikan hasil yang diinginkan tanpa menggunakan perintah yang kompleks. Proses penyesuaian ini disebut penyesuaian model. Penyesuaian model membantu Anda mengurangi biaya dan latensi permintaan dengan memungkinkan Anda menyederhanakan perintah Anda. Vertex AI juga menawarkan alat evaluasi model untuk membantu Anda mengevaluasi performa model yang disesuaikan. Setelah model yang disesuaikan siap produksi, Anda dapat men-deploy-nya ke endpoint dan memantau performa seperti dalam alur kerja MLOps standar. Vertex AI menawarkan beberapa cara untuk memberikan akses model ke API eksternal dan informasi real-time. Setelah respons dibuat, Vertex AI akan memeriksa apakah kutipan perlu disertakan dalam respons atau tidak. Jika sejumlah besar teks dalam respons berasal dari sumber tertentu, sumber tersebut akan ditambahkan ke metadata kutipan dalam respons. Lapisan pemeriksaan terakhir yang melewati prompt dan respons sebelum ditampilkan adalah filter keamanan. Vertex AI memeriksa prompt dan respons untuk mengetahui seberapa banyak prompt atau respons yang termasuk dalam kategori keamanan. Jika nilai minimum untuk satu atau beberapa kategori terlampaui, respons akan diblokir dan Vertex AI akan menampilkan respons penggantian. Jika prompt dan respons lulus pemeriksaan filter keamanan, respons akan ditampilkan. Biasanya, respons ditampilkan sekaligus. Namun, dengan Vertex AI, Anda juga dapat menerima respons secara bertahap karena peristiwa tersebut dihasilkan dengan mengaktifkan streaming. Coba salah satu panduan memulai ini untuk mulai menggunakan AI generatif di Vertex AI.
Gunakan SDK untuk mengirim permintaan ke Vertex AI Gemini API.
Uji perintah tanpa perlu penyiapan.
Buat gambar yang diberi tanda air menggunakan Imagen di Vertex AI.
Konsep
Pembuatan konten
Perintah
"Summarize the following article in three bullet points: [article text]"
Model dasar
Model Keluarga
Kasus Penggunaan Utama
Gemini API
Penalaran tingkat lanjut, percakapan multi-putaran, pembuatan kode, dan perintah multimodal (teks, gambar, video, audio).
Imagen API
Pembuatan gambar, pengeditan, dan visual captioning berkualitas tinggi.
MedLM (Tidak digunakan lagi)
Question answering dan peringkasan medis.
Penyesuaian model
Mengakses informasi eksternal
Opsi
Deskripsi
Kasus Penggunaan
Perujukan (Grounding)
Menghubungkan respons model ke sumber tepercaya, seperti data Anda sendiri atau penelusuran web.
Mengurangi halusinasi dan meningkatkan akurasi faktual dengan mengaitkan respons ke data tertentu.
Retrieval-Augmented Generation (RAG)
Menghubungkan model ke sumber pengetahuan eksternal, seperti dokumen dan database.
Menghasilkan respons yang lebih akurat dan informatif dengan mengambil informasi yang relevan dari pusat informasi yang besar.
Pemanggilan fungsi
Memungkinkan model berinteraksi dengan API eksternal.
Mendapatkan informasi real-time (misalnya, cuaca, harga saham) atau melakukan tugas di dunia nyata (misalnya, memesan penerbangan, mengirim email).
Pemeriksaan kutipan
Responsible AI dan keamanan
Respons
Mulai
Panduan pemula AI generatif
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-08-19 UTC.