Llama adalah kumpulan model terbuka yang dikembangkan oleh Meta yang dapat Anda sesuaikan dan deploy di Vertex AI. Llama menawarkan model generatif teks dan multimodal yang telah dilatih dan disesuaikan untuk mengikuti petunjuk.
Llama 4
Rangkaian model Llama 4 adalah kumpulan model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE). Dengan menggunakan arsitektur MoE, model dengan jumlah parameter yang sangat besar dapat mengaktifkan subset parameter tersebut untuk setiap input tertentu, yang menghasilkan inferensi yang lebih efisien. Selain itu, Llama 4 menggunakan penggabungan awal, yang mengintegrasikan informasi teks dan visual dari tahap pemrosesan awal. Metode ini memungkinkan model Llama 4 memahami hubungan yang kompleks dan bernuansa antara teks dan gambar secara lebih efektif. Model Garden di Vertex AI menawarkan dua model Llama 4: Llama 4 Scout dan Llama 4 Maverick.
Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 4 di Model Garden atau lihat postingan blog Memperkenalkan Llama 4 di Vertex AI.
Llama 4 Maverick
Llama 4 Maverick adalah model Llama 4 terbesar dan tercanggih, yang menawarkan kemampuan terdepan di industri untuk tolok ukur pengkodean, penalaran, dan gambar. Model ini menampilkan 17 miliar parameter aktif dari total 400 miliar parameter dengan 128 pakar. Llama 4 Maverick menggunakan lapisan MoE dan padat yang bergantian, dengan setiap token mengaktifkan pakar bersama dan salah satu dari 128 pakar yang dirutekan. Anda dapat menggunakan model sebagai model terlatih (PT) atau model yang disesuaikan dengan petunjuk (IT) dengan dukungan FP8. Model ini telah dilatih sebelumnya dalam 200 bahasa dan dioptimalkan untuk interaksi chat berkualitas tinggi melalui pipeline pasca-pelatihan yang ditingkatkan.
Llama 4 Maverick bersifat multimodal dan memiliki panjang konteks 1M. Model ini cocok untuk pemberian teks gambar tingkat lanjut, analisis, pemahaman gambar yang presisi, Tanya Jawab visual, pembuatan teks kreatif, asisten AI serbaguna, dan chatbot canggih yang memerlukan pemahaman gambar dan kecerdasan tingkat atas.
Llama 4 Scout
Llama 4 Scout memberikan hasil terbaik untuk kelas ukurannya dengan jendela konteks besar 10 juta token, yang mengungguli generasi Llama sebelumnya dan model terbuka serta berpemilik lainnya pada beberapa tolok ukur. Model ini memiliki 17 miliar parameter aktif dari total 109 miliar parameter dengan 16 pakar dan tersedia sebagai model terlatih (PT) atau model yang dioptimalkan untuk mengikuti perintah (IT). Llama 4 Scout cocok untuk tugas pengambilan dalam konteks panjang dan tugas yang memerlukan penalaran atas sejumlah besar informasi, seperti meringkas beberapa dokumen besar, menganalisis log interaksi pengguna yang ekstensif untuk personalisasi dan penalaran di seluruh codebase besar.
Llama 3.3
Llama 3.3 adalah model yang disesuaikan untuk perintah 70B khusus teks yang memberikan peningkatan performa dibandingkan Llama 3.1 70B dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Selain itu, untuk beberapa aplikasi, Llama 3.3 70B mendekati performa Llama 3.1 405B.
Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3.3 di Model Garden.
Llama 3.2
Llama 3.2 memungkinkan developer membangun dan men-deploy model dan aplikasi AI generatif terbaru yang menggunakan kemampuan Llama untuk memicu inovasi baru, seperti penalaran gambar. Llama 3.2 juga didesain agar lebih mudah diakses untuk aplikasi di perangkat. Daftar berikut menyoroti fitur Llama 3.2:
- Menawarkan pengalaman AI yang lebih pribadi dan dipersonalisasi, dengan pemrosesan di perangkat untuk model yang lebih kecil.
- Menawarkan model yang dirancang agar lebih efisien, dengan latensi yang lebih rendah dan performa yang lebih baik, sehingga cocok untuk berbagai aplikasi.
- Dibangun di atas Llama Stack, yang mempermudah pembuatan dan deployment aplikasi. Llama Stack adalah antarmuka standar untuk membangun komponen toolchain kanonis dan aplikasi agentik.
- Mendukung tugas terkait penglihatan, dengan arsitektur model baru yang mengintegrasikan representasi encoder gambar ke dalam model bahasa.
Model 1B dan 3B adalah model ringan khusus teks yang mendukung kasus penggunaan di perangkat seperti pengambilan, peringkasan, dan penulisan ulang pengetahuan lokal multibahasa.
Model Llama 11B dan 90B adalah model multimodal berukuran kecil dan sedang dengan kemampuan penalaran gambar. Misalnya, model dapat menganalisis data visual dari diagram untuk memberikan respons yang lebih akurat dan mengekstrak detail dari gambar untuk membuat deskripsi teks.
Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3.2 di Model Garden.
Pertimbangan
Saat menggunakan 11B dan 90B, tidak ada batasan saat Anda mengirimkan perintah hanya teks. Namun, jika Anda menyertakan gambar dalam perintah, gambar harus berada di awal perintah, dan Anda hanya dapat menyertakan satu gambar. Misalnya, Anda tidak dapat menyertakan beberapa teks, lalu gambar.
Llama 3.1
Kumpulan model bahasa besar (LLM) multilingue Llama 3.1 adalah kumpulan model generatif yang telah dilatih sebelumnya dan dioptimalkan untuk mengikuti perintah dalam ukuran 8B, 70B, dan 405B (teks masuk/teks keluar). Model khusus teks yang disesuaikan untuk perintah Llama 3.1 (8B, 70B, 405B) dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat open source dan tertutup yang tersedia pada tolok ukur industri umum.
Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3.1 di Model Garden.
Llama 3
Model yang di-tuning untuk mengikuti perintah Llama 3 adalah kumpulan LLM yang dioptimalkan untuk kasus penggunaan dialog. Model Llama 3 mengungguli banyak model chat open source yang tersedia pada tolok ukur industri umum.
Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3 di Model Garden.
Llama 2
LLM Llama 2 adalah kumpulan model teks generatif terlatih dan yang telah disesuaikan, dengan ukuran mulai dari 7B hingga 70B parameter.
Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 2 di Model Garden.
Code Llama
Model Code Llama Meta dirancang untuk sintesis, pemahaman, dan petunjuk kode.
Untuk mengetahui informasi selengkapnya, lihat kartu model Code Llama di Model Garden.
Llama Guard 3
Llama Guard 3 dibangun berdasarkan kemampuan Llama Guard 2, dengan menambahkan tiga kategori baru: Pencemaran Nama Baik, Pemilu, dan Penyalahgunaan Code Interpreter. Selain itu, model ini bersifat multibahasa dan memiliki format perintah yang konsisten dengan model perintah Llama 3 atau yang lebih baru.
Untuk mengetahui informasi selengkapnya, lihat kartu model LlamaGuard di Model Garden.
Resource
Untuk mengetahui informasi selengkapnya tentang Model Garden, lihat Menjelajahi model AI di Model Garden.