Model Llama yang di-deploy sendiri

Llama adalah kumpulan model terbuka yang dikembangkan oleh Meta yang dapat Anda sesuaikan dan deploy di Vertex AI. Llama menawarkan model teks dan multimodal generatif yang telah dilatih dan disesuaikan dengan petunjuk.

Llama 4

Rangkaian model Llama 4 adalah kumpulan model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE). Dengan menggunakan arsitektur MoE, model dengan jumlah parameter yang sangat besar dapat mengaktifkan subset parameter tersebut untuk input tertentu, yang menghasilkan inferensi yang lebih efisien. Selain itu, Llama 4 menggunakan penggabungan awal, yang mengintegrasikan informasi teks dan visi dari tahap pemrosesan awal. Metode ini memungkinkan model Llama 4 memahami hubungan yang rumit dan bernuansa antara teks dan gambar secara lebih efektif. Model Garden di Vertex AI menawarkan dua model Llama 4: Llama 4 Scout dan Llama 4 Maverick.

Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 4 di Model Garden atau lihat Memperkenalkan Llama 4 di postingan blog Vertex AI.

Llama 4 Maverick

Llama 4 Maverick adalah model Llama 4 terbesar dan tercanggih, yang menawarkan kemampuan terdepan di industri dalam benchmark coding, penalaran, dan gambar. Model ini memiliki 17 miliar parameter aktif dari total 400 miliar parameter dengan 128 pakar. Llama 4 Maverick menggunakan lapisan MoE dan padat yang bergantian, dengan setiap token mengaktifkan pakar bersama ditambah salah satu dari 128 pakar yang dirutekan. Anda dapat menggunakan model sebagai model terlatih (PT) atau model yang disesuaikan dengan petunjuk (IT) dengan dukungan FP8. Model ini telah dilatih sebelumnya dalam 200 bahasa dan dioptimalkan untuk interaksi chat berkualitas tinggi melalui pipeline pasca-pelatihan yang ditingkatkan.

Llama 4 Maverick bersifat multimodal dan memiliki panjang konteks 1 juta. Model ini cocok untuk teks visual lanjutan, analisis, pemahaman gambar yang akurat, tanya jawab visual, pembuatan teks kreatif, asisten AI tujuan umum, dan chatbot canggih yang memerlukan kecerdasan dan pemahaman gambar tingkat atas.

Llama 4 Scout

Llama 4 Scout memberikan hasil terbaik untuk kelas ukurannya dengan jendela konteks 10 juta token yang besar, yang mengungguli generasi Llama sebelumnya dan model terbuka dan eksklusif lainnya pada beberapa benchmark. Model ini memiliki 17 miliar parameter aktif dari total 109 miliar parameter dengan 16 pakar dan tersedia sebagai model terlatih (PT) atau disesuaikan dengan petunjuk (IT). Llama 4 Scout cocok untuk tugas pengambilan dalam konteks yang panjang dan tugas yang memerlukan penalaran atas informasi dalam jumlah besar, seperti meringkas beberapa dokumen besar, menganalisis log interaksi pengguna yang luas untuk personalisasi dan penalaran di seluruh codebase besar.

Llama 3.3

Llama 3.3 adalah model yang disesuaikan dengan petunjuk 70B khusus teks yang memberikan performa yang lebih baik dibandingkan dengan Llama 3.1 70B dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Selain itu, untuk beberapa aplikasi, Llama 3.3 70B mendekati performa Llama 3.1 405B.

Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3.3 di Model Garden.

Llama 3.2

Llama 3.2 memungkinkan developer mem-build dan men-deploy model AI generatif terbaru dan aplikasi yang menggunakan kemampuan Llama untuk memicu inovasi baru, seperti penalaran gambar. Llama 3.2 juga didesain agar lebih mudah diakses untuk aplikasi di perangkat. Daftar berikut menyoroti fitur Llama 3.2:

  • Menawarkan pengalaman AI yang lebih pribadi dan dipersonalisasi, dengan pemrosesan di perangkat untuk model yang lebih kecil.
  • Menawarkan model yang dirancang agar lebih efisien, dengan latensi yang lebih rendah dan performa yang lebih baik, sehingga cocok untuk berbagai aplikasi.
  • Dibuat di atas Llama Stack, yang mempermudah pembuatan dan deployment aplikasi. Llama Stack adalah antarmuka standar untuk mem-build komponen toolchain kanonis dan aplikasi agen.
  • Mendukung tugas visi, dengan arsitektur model baru yang mengintegrasikan representasi encoder gambar ke dalam model bahasa.

Model 1B dan 3B adalah model khusus teks ringan yang mendukung kasus penggunaan di perangkat seperti pengambilan, ringkasan, dan penulisan ulang pengetahuan lokal multibahasa.

Model Llama 11B dan 90B adalah model multimodal berukuran kecil dan sedang dengan penalaran gambar. Misalnya, model ini dapat menganalisis data visual dari diagram untuk memberikan respons yang lebih akurat dan mengekstrak detail dari gambar untuk menghasilkan deskripsi teks.

Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3.2 di Model Garden.

Pertimbangan

Saat menggunakan 11B dan 90B, tidak ada batasan saat Anda mengirim perintah teks saja. Namun, jika Anda menyertakan gambar dalam perintah, gambar harus berada di awal perintah, dan Anda hanya dapat menyertakan satu gambar. Anda tidak dapat, misalnya, menyertakan beberapa teks, lalu gambar.

Llama 3.1

Kumpulan model bahasa besar (LLM) multibahasa Llama 3.1 adalah kumpulan model generatif terlatih dan disesuaikan dengan petunjuk dalam ukuran 8B, 70B, dan 405B (teks masuk/teks keluar). Model khusus teks yang disesuaikan dengan petunjuk Llama 3.1 (8B, 70B, 405B) dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat tertutup dan open source yang tersedia pada benchmark industri umum.

Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3.1 di Model Garden.

Llama 3

Model yang disesuaikan dengan petunjuk Llama 3 adalah kumpulan LLM yang dioptimalkan untuk kasus penggunaan dialog. Model Llama 3 mengungguli banyak model chat open source yang tersedia pada benchmark industri umum.

Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 3 di Model Garden.

Llama 2

LLM Llama 2 adalah kumpulan model teks generatif terlatih dan disesuaikan, yang ukurannya berkisar dari 7 miliar hingga 70 miliar parameter.

Untuk mengetahui informasi selengkapnya, lihat kartu model Llama 2 di Model Garden.

Code Llama

Model Code Llama Meta dirancang untuk sintesis, pemahaman, dan petunjuk kode.

Untuk mengetahui informasi selengkapnya, lihat kartu model Code Llama di Model Garden.

Llama Guard 3

Llama Guard 3 dibuat berdasarkan kemampuan Llama Guard 2, dengan menambahkan tiga kategori baru: Pencemaran Nama Baik, Pemilu, dan Penyalahgunaan Penafsir Kode. Selain itu, model ini multibahasa dan memiliki format perintah yang konsisten dengan model instruksi Llama 3 atau yang lebih baru.

Untuk mengetahui informasi selengkapnya, lihat kartu model Llama Guard di Model Garden.

Resource

Untuk mengetahui informasi selengkapnya tentang Model Garden, lihat Menjelajahi model AI di Model Garden.