ttl
- Jumlah detik dan nanodetik yang digunakan cache setelah cache tersebut dibuat atau setelahttl
diperbarui sebelum masa berlakunya berakhir. Saat Anda menetapkanttl
,expireTime
cache akan diperbarui.expire_time
-Timestamp
yang menentukan tanggal dan waktu absolut saat cache konteks berakhir masa berlakunya.
Memperbarui cache konteks menggunakan parameter ttl
-nya
Berikut adalah contoh perintah curl yang memperbarui waktu habis masa berlakunya selama 3.600 detik.
Gen AI SDK for Python
Instal
pip install --upgrade google-genai
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Anda dapat menggunakan REST untuk membuat pembaruan cache konteks menggunakan
Vertex AI API untuk mengirim permintaan PATCH ke endpoint model penayang. Contoh
berikut menunjukkan cara memperbarui tanggal habis masa berlaku menggunakan
parameter ttl
.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Project ID Anda.
- LOCATION: Region tempat permintaan untuk membuat cache konteks diproses.
- CACHE_ID: ID cache konteks. ID cache konteks ditampilkan saat Anda membuat cache konteks. Anda juga dapat menemukan ID cache konteks dengan mencantumkan cache konteks untuk project Google Cloud menggunakan. Untuk informasi selengkapnya, lihat membuat cache konteks dan mencantumkan cache konteks.
- SECONDS:
float
yang menentukan komponen detik dari durasi sebelum cache berakhir masa berlakunya. - NANOSECONDS:
float
yang menentukan komponen durasi dalam nanodetik sebelum cache berakhir masa berlakunya.
Metode HTTP dan URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Isi JSON permintaan:
{ "seconds":"SECONDS", "nanos":"NANOSECONDS" }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
Contoh perintah curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"ttl": {"seconds":"3600","nanos":"0"}
}'
Memperbarui cache konteks menggunakan parameter expire_time
-nya
Berikut adalah contoh perintah curl yang menggunakan parameter expire_time
untuk memperbarui waktu habis masa berlakunya menjadi pukul 09.00 pada 30 Juni 2024.
REST
Anda dapat menggunakan REST untuk membuat pembaruan cache konteks menggunakan
Vertex AI API untuk mengirim permintaan PATCH ke endpoint model penayang. Contoh
berikut menunjukkan cara memperbarui tanggal habis masa berlaku menggunakan
parameter expire_time
.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Project ID Anda.
- LOCATION: Region tempat permintaan untuk membuat cache konteks diproses.
- CACHE_ID: ID cache konteks. Anda dapat menemukan ID dalam respons saat membuat cache konteks.
- EXPIRE_TIME:
Timestamp
yang menentukan waktu berakhirnya masa berlaku cache konteks.
Metode HTTP dan URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Isi JSON permintaan:
{ "expire_time":"EXPIRE_TIME" }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
Contoh perintah curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"expire_time":"2024-06-30T09:00:00.000000Z"
}'
Langkah berikutnya
- Pelajari cara menggunakan cache konteks.
- Pelajari cara mendapatkan informasi tentang semua cache konteks yang terkait dengan project Google Cloud.