ttl
:快取建立後或ttl
更新後,快取的存留時間 (以秒和奈秒為單位)。設定ttl
時,快取的expireTime
會更新。expire_time
:指定脈絡快取到期日的絕對日期和時間。Timestamp
使用 ttl
參數更新脈絡快取
以下是 curl 指令範例,可將到期時間更新為 3,600 秒。
Gen AI SDK for Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,以便透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Gen AI SDK for Go
瞭解如何安裝或更新 Gen AI SDK for Go。
詳情請參閱 SDK 參考說明文件。
設定環境變數,以便透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
您可以使用 REST 建立更新情境快取,方法是使用 Vertex AI API 將 PATCH 要求傳送至發布者模型端點。以下範例說明如何使用 ttl
參數更新到期日。
使用任何要求資料之前,請先替換以下項目:
- PROJECT_ID:您的專案 ID。
- LOCATION:處理建立脈絡快取要求的區域。
- CACHE_ID:結構定義快取的 ID。建立脈絡快取時,系統會傳回脈絡快取 ID。您也可以列出 Google Cloud 專案使用的脈絡快取,藉此找出脈絡快取 ID。詳情請參閱「建立脈絡快取」和「列出脈絡快取」。
- SECONDS:指定快取過期前所需時間的秒數。
float
- NANOSECONDS:指定快取過期前時間長度的
float
,以奈秒為單位。
HTTP 方法和網址:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
JSON 要求主體:
{ "seconds":"SECONDS", "nanos":"NANOSECONDS" }
如要傳送要求,請選擇以下其中一個選項:
curl
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
您應該會收到類似以下的 JSON 回應:
curl 指令範例
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"ttl": {"seconds":"3600","nanos":"0"}
}'
使用 expire_time
參數更新脈絡快取
以下是 curl 指令的範例,該指令會使用 expire_time
參數將到期時間更新為 2024 年 6 月 30 日上午 9 點。
REST
您可以使用 REST 建立更新情境快取,方法是使用 Vertex AI API 將 PATCH 要求傳送至發布者模型端點。以下範例說明如何使用 expire_time
參數更新到期日。
使用任何要求資料之前,請先替換以下項目:
- PROJECT_ID:您的專案 ID。
- LOCATION:處理建立脈絡快取要求的區域。
- CACHE_ID:結構定義快取的 ID。建立內容快取時,您可以在回應中找到 ID。
- EXPIRE_TIME:指定脈絡快取到期時間的
Timestamp
。
HTTP 方法和網址:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
JSON 要求主體:
{ "expire_time":"EXPIRE_TIME" }
如要傳送要求,請選擇以下其中一個選項:
curl
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
您應該會收到類似以下的 JSON 回應:
curl 指令範例
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"expire_time":"2024-06-30T09:00:00.000000Z"
}'
後續步驟
- 瞭解如何使用脈絡快取。
- 瞭解如何取得與 Google Cloud 專案相關聯的所有內容快取資訊。