ttl
) atau stempel waktu tertentu (expire_time
).
Tabel berikut membandingkan kedua parameter untuk memperbarui cache konteks.
Parameter | Deskripsi | Kasus Penggunaan |
---|---|---|
ttl (Time To Live) |
Menetapkan waktu habis masa berlaku relatif. Cache akan habis masa berlakunya setelah durasi yang ditentukan berlalu sejak waktu update. | Gunakan saat Anda ingin cache tersedia selama durasi tertentu, seperti "tetap aktif selama 2 jam ke depan". |
expire_time |
Menetapkan waktu habis masa berlaku absolut. Cache akan habis masa berlakunya pada tanggal dan waktu yang ditentukan, terlepas dari kapan pembaruan dilakukan. | Gunakan saat Anda ingin cache berakhir pada waktu yang tepat, seperti "cache ini harus dihapus paling lambat tengah malam pada 30 Juni". |
Memperbarui context cache menggunakan parameter ttl
Contoh berikut menunjukkan cara memperbarui waktu habis masa berlaku cache sebanyak 3.600 detik.
Python
Instal
pip install --upgrade google-genai
Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Go
Pelajari cara menginstal atau mengupdate Go.
Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Untuk memperbarui cache konteks dengan REST API, kirim permintaan PATCH
ke Vertex AI API. Contoh berikut memperbarui tanggal habis masa berlaku menggunakan parameter ttl
.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Project ID Anda.
- LOCATION: Region tempat permintaan untuk membuat cache konteks diproses.
- CACHE_ID: ID cache konteks. ID context cache ditampilkan saat Anda membuat context cache. Anda juga dapat menemukan ID context cache dengan mencantumkan context cache untuk project Google Cloud menggunakan. Untuk mengetahui informasi selengkapnya, lihat membuat context cache dan mencantumkan context cache.
- SECONDS:
float
yang menentukan komponen detik durasi sebelum cache berakhir. - NANOSECONDS:
float
yang menentukan komponen nanodetik durasi sebelum cache berakhir.
Metode HTTP dan URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Isi JSON permintaan:
{ "seconds":"SECONDS", "nanos":"NANOSECONDS" }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
Contoh perintah curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"ttl": {"seconds":"3600","nanos":"0"}
}'
Memperbarui context cache menggunakan parameter expire_time
Contoh berikut menunjukkan cara menggunakan parameter expire_time
untuk memperbarui waktu habis masa berlaku cache menjadi 30 Juni 2024 pukul 09.00.
REST
Untuk memperbarui cache konteks dengan REST API, kirim permintaan PATCH
ke Vertex AI API. Contoh berikut memperbarui tanggal habis masa berlaku menggunakan parameter expire_time
.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: .
- LOCATION: Region tempat permintaan untuk membuat cache konteks diproses.
- CACHE_ID: ID cache konteks. Anda dapat menemukan ID dalam respons saat Anda membuat cache konteks.
- EXPIRE_TIME:
Timestamp
yang menentukan waktu saat context cache berakhir.
Metode HTTP dan URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Isi JSON permintaan:
{ "expire_time":"EXPIRE_TIME" }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
Contoh perintah curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"expire_time":"2024-06-30T09:00:00.000000Z"
}'
Langkah berikutnya
- Pelajari cara menggunakan context cache.
- Pelajari cara mendapatkan informasi tentang semua cache konteks yang terkait dengan Google Cloud project.