Panduan pemula AI generatif

Panduan ini memperkenalkan konsep inti AI generatif dan alur kerja untuk membangun aplikasi di Vertex AI, yang mencakup topik berikut:

  • Alur kerja pembuatan konten: Ringkasan proses end-to-end, mulai dari memberikan perintah pada model hingga menerima respons yang aman dan relevan.
  • Model dasar: Melihat berbagai jenis model AI generatif yang tersedia di Vertex AI, termasuk model Gemini multimodal.
  • Penyesuaian dan augmentasi model: Cara menyesuaikan model untuk tugas tertentu dan menghubungkannya ke informasi eksternal menggunakan perujukan dan panggilan fungsi.
  • Mulai menggunakan panduan memulai: Link ke tutorial praktik untuk mulai membangun dengan AI generatif di Vertex AI.

Panduan pemula ini memperkenalkan Anda pada teknologi inti AI generatif dan menjelaskan cara teknologi tersebut bekerja sama untuk mendukung chatbot dan aplikasi. AI generatif (juga dikenal sebagai genAI atau gen AI) adalah bidang machine learning (ML) yang mengembangkan dan menggunakan model ML untuk menghasilkan konten baru.

Model AI generatif sering disebut model bahasa besar (LLM) karena ukurannya yang besar serta kemampuannya untuk memahami dan menghasilkan bahasa alami. Namun, bergantung pada data yang digunakan untuk melatih model, model ini dapat memahami dan menghasilkan konten dari berbagai modalitas, termasuk teks, gambar, video, dan audio. Model yang berfungsi dengan beberapa modalitas data disebut model multimodal.

Google menyediakan rangkaian model AI generatif Gemini yang dirancang untuk kasus penggunaan multimodal; mampu memproses informasi dari berbagai modalitas, termasuk gambar, video, dan teks.

Konsep

  • Perintah: Permintaan bahasa alami yang dikirim ke model AI generatif untuk mendapatkan respons.
  • Model Dasar: Model AI generatif besar yang sudah dilatih sebelumnya, seperti Gemini, yang dapat digunakan untuk berbagai tugas.
  • Penyesuaian Model: Proses penyesuaian model dasar untuk melakukan tugas tertentu secara lebih efektif.
  • Perujukan: Proses menghubungkan respons model ke sumber informasi yang dapat diverifikasi untuk meningkatkan akurasi dan mengurangi halusinasi.
  • Pemanggilan Fungsi (Function Calling): Fitur yang memungkinkan model berinteraksi dengan API eksternal untuk mengambil informasi real-time atau melakukan tindakan.

Pembuatan konten

Agar model AI generatif dapat menghasilkan konten yang berguna dalam aplikasi dunia nyata, model tersebut harus memiliki kemampuan berikut:

  • Pelajari cara melakukan tugas baru: Model AI generatif dirancang untuk melakukan tugas umum. Jika Anda ingin model melakukan tugas yang unik untuk kasus penggunaan Anda, Anda harus dapat menyesuaikan model. Di Vertex AI, Anda dapat menyesuaikan model melalui penyesuaian model.
  • Mengakses informasi eksternal: Model AI generatif dilatih menggunakan sejumlah besar data. Namun, agar model ini bermanfaat, model harus dapat mengakses informasi di luar data pelatihannya. Misalnya, jika Anda ingin membuat chatbot layanan pelanggan yang didukung oleh model AI generatif, model tersebut harus memiliki akses ke informasi tentang produk dan layanan yang Anda tawarkan. Di Vertex AI, Anda menggunakan fitur perujukan dan panggilan fungsi untuk membantu model mengakses informasi eksternal.
  • Memblokir konten berbahaya: Model AI generatif dapat menghasilkan output yang tidak Anda duga, termasuk teks yang menyinggung atau tidak peka. Untuk menjaga keamanan dan mencegah penyalahgunaan, model memerlukan filter keamanan untuk memblokir perintah dan respons yang dianggap berpotensi berbahaya. Vertex AI memiliki fitur keamanan bawaan yang mendorong penggunaan layanan AI generatif kami secara bertanggung jawab.

Diagram berikut merangkum alur kerja keseluruhan:

Perintah

Alur kerja AI generatif biasanya dimulai dengan prompt. Perintah adalah permintaan bahasa alami yang dikirim ke model AI generatif untuk mendapatkan respons. Bergantung pada modelnya, perintah dapat berisi teks, gambar, video, audio, dokumen, atau beberapa modalitas (multimodal).

Misalnya, perintah teks sederhana dapat berupa:

"Summarize the following article in three bullet points: [article text]"

Membuat perintah untuk mendapatkan respons yang diinginkan dari model adalah praktik yang disebut desain perintah. Meskipun desain prompt merupakan proses uji coba, ada prinsip dan strategi desain prompt yang dapat Anda gunakan untuk mendorong model agar berperilaku dengan cara yang diinginkan. Vertex AI Studio menawarkan alat pengelolaan perintah untuk membantu Anda mengelola perintah.

Model dasar

Perintah dikirim ke model AI generatif untuk pembuatan respons. Vertex AI memiliki berbagai model dasar AI generatif yang dapat diakses melalui API terkelola.

Model tersebut memiliki ukuran, modalitas, dan biaya yang berbeda. Tabel berikut memberikan ringkasan umum:

Model Keluarga Kasus Penggunaan Utama
Gemini API Penalaran tingkat lanjut, percakapan multi-putaran, pembuatan kode, dan perintah multimodal (teks, gambar, video, audio).
Imagen API Pembuatan gambar, pengeditan, dan visual captioning berkualitas tinggi.
MedLM (Tidak digunakan lagi) Question answering dan peringkasan medis.

Anda dapat menjelajahi model Google, serta model terbuka dan model dari partner Google, di Model Garden.

Penyesuaian model

Anda dapat menyesuaikan perilaku default model dasar Google agar dapat secara konsisten memberikan hasil yang diinginkan tanpa menggunakan perintah yang kompleks. Proses penyesuaian ini disebut penyesuaian model. Penyesuaian model membantu Anda mengurangi biaya dan latensi permintaan dengan memungkinkan Anda menyederhanakan perintah Anda.

Vertex AI juga menawarkan alat evaluasi model untuk membantu Anda mengevaluasi performa model yang disesuaikan. Setelah model yang disesuaikan siap produksi, Anda dapat men-deploy-nya ke endpoint dan memantau performa seperti dalam alur kerja MLOps standar.

Mengakses informasi eksternal

Vertex AI menawarkan beberapa cara untuk memberikan akses model ke API eksternal dan informasi real-time.

Opsi Deskripsi Kasus Penggunaan
Perujukan (Grounding) Menghubungkan respons model ke sumber tepercaya, seperti data Anda sendiri atau penelusuran web. Mengurangi halusinasi dan meningkatkan akurasi faktual dengan mengaitkan respons ke data tertentu.
Retrieval-Augmented Generation (RAG) Menghubungkan model ke sumber pengetahuan eksternal, seperti dokumen dan database. Menghasilkan respons yang lebih akurat dan informatif dengan mengambil informasi yang relevan dari pusat informasi yang besar.
Pemanggilan fungsi Memungkinkan model berinteraksi dengan API eksternal. Mendapatkan informasi real-time (misalnya, cuaca, harga saham) atau melakukan tugas di dunia nyata (misalnya, memesan penerbangan, mengirim email).

Pemeriksaan kutipan

Setelah respons dibuat, Vertex AI akan memeriksa apakah kutipan perlu disertakan dalam respons atau tidak. Jika sejumlah besar teks dalam respons berasal dari sumber tertentu, sumber tersebut akan ditambahkan ke metadata kutipan dalam respons.

Responsible AI dan keamanan

Lapisan pemeriksaan terakhir yang melewati prompt dan respons sebelum ditampilkan adalah filter keamanan. Vertex AI memeriksa prompt dan respons untuk mengetahui seberapa banyak prompt atau respons yang termasuk dalam kategori keamanan. Jika nilai minimum untuk satu atau beberapa kategori terlampaui, respons akan diblokir dan Vertex AI akan menampilkan respons penggantian.

Respons

Jika prompt dan respons lulus pemeriksaan filter keamanan, respons akan ditampilkan. Biasanya, respons ditampilkan sekaligus. Namun, dengan Vertex AI, Anda juga dapat menerima respons secara bertahap karena peristiwa tersebut dihasilkan dengan mengaktifkan streaming.

Mulai

Coba salah satu panduan memulai ini untuk mulai menggunakan AI generatif di Vertex AI.