Chat Completions API berfungsi sebagai endpoint yang kompatibel dengan Open AI, yang dirancang untuk memudahkan antarmuka dengan Gemini di Vertex AI dengan menggunakan library OpenAI untuk Python dan REST. Jika sudah menggunakan library OpenAI, Anda dapat menggunakan API ini sebagai cara hemat biaya untuk beralih antara memanggil model OpenAI dan model yang dihosting Vertex AI untuk membandingkan output, biaya, dan skalabilitas, tanpa mengubah kode yang ada. Jika Anda belum menggunakan library OpenAI, sebaiknya Anda menggunakan Google Gen AI SDK.
Model yang didukung
Chat Completions API mendukung model Gemini dan model tertentu yang di-deploy sendiri dari Model Garden.
Model Gemini
Model berikut memberikan dukungan untuk Chat Completions API:
Model yang di-deploy sendiri dari Model Garden
Penampung Hugging Face Text Generation Interface (HF TGI) dan vLLM bawaan Vertex AI Model Garden mendukung Chat Completions API. Namun, tidak semua model yang di-deploy ke penampung ini mendukung Chat Completions API. Tabel berikut menyertakan model yang didukung dan paling populer menurut penampung:
HF TGI |
vLLM |
---|---|
Parameter yang didukung
Untuk model Google, Chat Completions API mendukung parameter OpenAI berikut. Untuk deskripsi setiap parameter, lihat dokumentasi OpenAI tentang Membuat penyelesaian chat. Dukungan parameter untuk model pihak ketiga bervariasi menurut model. Untuk melihat parameter yang didukung, lihat dokumentasi model.
messages |
|
model |
|
max_tokens |
|
n |
|
frequency_penalty |
|
presence_penalty |
|
response_format |
|
stop |
|
stream |
|
temperature |
|
top_p |
|
tools |
|
tool_choice |
|
function_call |
Kolom ini tidak digunakan lagi, tetapi didukung untuk kompatibilitas mundur. |
functions |
Kolom ini tidak digunakan lagi, tetapi didukung untuk kompatibilitas mundur. |
Jika Anda meneruskan parameter yang tidak didukung, parameter tersebut akan diabaikan.
Parameter input multimodal
Chat Completions API mendukung input multimodal tertentu.
input_audio |
|
image_url |
|
Secara umum, parameter data
dapat berupa URI atau kombinasi jenis MIME dan
byte berenkode base64 dalam bentuk "data:<MIME-TYPE>;base64,<BASE64-ENCODED-BYTES>"
.
Untuk mengetahui daftar lengkap jenis MIME, lihat GenerateContent
.
Untuk informasi selengkapnya tentang encoding base64 OpenAI, lihat dokumentasinya.
Untuk penggunaannya, lihat contoh input multimodal.
Parameter khusus Gemini
Ada beberapa fitur yang didukung oleh Gemini yang tidak tersedia di model OpenAI.
Fitur ini masih dapat diteruskan sebagai parameter, tetapi harus berada dalam
extra_content
atau extra_body
atau akan diabaikan.
Fitur extra_body
safety_settings |
Ini sesuai dengan SafetySetting Gemini. |
cached_content |
Ini sesuai dengan GenerateContentRequest.cached_content Gemini. |
thought_tag_marker |
Digunakan untuk memisahkan pemikiran model dari responsnya untuk model dengan Pemikiran yang tersedia. Jika tidak ditentukan, tidak ada tag yang akan ditampilkan di sekitar pemikiran model. Jika ada, kueri berikutnya akan menghapus tag pemikiran dan menandai pemikiran dengan tepat untuk konteks. Hal ini membantu mempertahankan konteks yang sesuai untuk kueri berikutnya. |
Langkah berikutnya
- Pelajari lebih lanjut autentikasi dan kredensial dengan sintaksis yang kompatibel dengan OpenAI.
- Lihat contoh pemanggilan Chat Completions API dengan sintaksis yang kompatibel dengan OpenAI.
- Lihat contoh pemanggilan Inference API dengan sintaksis yang kompatibel dengan OpenAI.
- Lihat contoh pemanggilan Function Calling API dengan sintaksis yang kompatibel dengan OpenAI.
- Pelajari Gemini API lebih lanjut.
- Pelajari lebih lanjut cara bermigrasi dari Azure OpenAI ke Gemini API.