本文件說明如何在 Compute Engine、任何雲端虛擬機器、RISE with S/4HANA Cloud Private 版或內部部署的執行個體上,安裝及設定 ABAP 適用的 Vertex AI SDK。
安裝
當您安裝最新版的 ABAP 適用於 Google Cloud 的內部部署版或任何雲端版 ABAP SDK 時,系統會為您安裝 ABAP 適用的 Vertex AI SDK。如需安裝步驟的相關資訊,請參閱「為 Google Cloud 安裝及設定內部部署或任何雲端版本的 ABAP SDK」。
如果您使用的是 1.7 以下版本的 ABAP SDK for Google Cloud 或任何雲端版本,請將 SDK 更新至最新版本,以便取得 ABAP 專用的 Vertex AI SDK。如需更多資訊,請參閱「更新 Google Cloud 適用的 ABAP SDK」。
我們瞭解有些開發人員可能無法使用 Vertex AI 和雲端資源。如要以最少的設定啟用原型設計和實驗功能,請參閱「使用 Gemini 快速設計原型」。
啟用 Vertex AI API
在 Google Cloud 專案中啟用 Vertex AI API。
如要瞭解如何啟用 Google Cloud API,請參閱「啟用 API」。
驗證
設定驗證機制後,您就能在內部部署或任何 Google Cloud ABAP SDK 雲端版本中存取 API。ABAP Vertex AI SDK 會使用相同的驗證方法存取 Vertex AI API。 Google Cloud 如要瞭解如何在內部部署或任何雲端版 ABAP SDK for Google Cloud 中設定驗證機制,請參閱「驗證機制總覽」。
請記下您在驗證設定中建立的用戶端金鑰。您可以在設定 AI 模型產生參數和搜尋參數時使用這個用戶端金鑰。
IAM 權限
請確認您在用戶端金鑰表格中設定的 API 存取專用服務帳戶,是否有權存取 Vertex AI 資源。
Vertex AI
如要使用 Vertex AI 資源,您必須將 Vertex AI 使用者 (roles/aiplatform.user
) 角色授予專屬服務帳戶,並向該帳戶授予存取 Vertex AI API 的權限。
如果您需要提供特定權限,才能建立、修改或部署構件,請視情況授予特定 Vertex AI IAM 權限。
Vertex AI 特徵儲存庫
如要使用 Vertex AI 特徵儲存庫,您必須向服務帳戶授予下列角色:
AI 功能 | 必要的 IAM 角色 |
---|---|
Vertex AI 特徵儲存庫 |
設定模型產生參數
大型語言模型 (LLM) 是一種深度學習模型,以大量文字資料訓練而成。模型包含參數值,用來控制模型生成回覆的方式。您可以變更參數值,從模型中取得不同的結果。
為定義模型的生成參數,ABAP 專用的 Vertex AI SDK 會使用 /GOOG/AI_CONFIG
資料表。
如要設定模型的產生參數,請執行下列步驟:
在 SAP GUI 中執行交易代碼
/GOOG/SDK_IMG
。或者,您也可以執行交易代碼
SPRO
,然後按一下「SAP Reference IMG」。依序點選「ABAP SDK for Google Cloud」>「Vertex AI SDK:設定模型產生參數」。
按一下「新增項目」。
在下列欄位中輸入值:
欄位 資料類型 說明 模型索引鍵 字串 您指定的專屬名稱,用於識別模型設定,例如
Gemini
。您可以在例項化生成模型類別或嵌入類別時使用這個模型鍵,指定要生效的生成設定。
模型 ID 字串 LLM 的模型 ID,例如
gemini-1.5-flash-001
。如要瞭解 Vertex AI 模型版本,請參閱「模型版本和生命週期」。
Google Cloud 金鑰名稱 字串 您在驗證設定期間為驗證設定的用戶端金鑰。 Google Cloud Google Cloud 區域位置 ID 字串 您要使用的 Vertex AI 功能可用的 Google Cloud 區域位置 ID。
一般來說,您應使用離自己或目標使用者實際位置最近的地區。詳情請參閱「Vertex AI 位置」。
LLM 的發布商 ID 字串 (非必要) LLM 的發布者,例如 google
。回應 MIME 類型 字串 (非必要) 產生的候選文字輸出回應 MIME 類型。支援的 MIME 類型: text/plain
:文字輸出內容 (預設)。application/json
:候選項目中的 JSON 回應。
隨機性溫度 字串 (非必要) 控制預測的隨機程度。詳情請參閱「溫度」。
範圍:[0.0, 1.0]
前 K 大取樣 浮點值 (非必要) Top-K 會影響模型選取輸出詞元的方式。
如要取得較不隨機的回覆,請指定較低的值;如要取得較隨機的回覆,請調高此值。詳情請參閱「Top-K」。
範圍:[1, 40]
Top-P 取樣 浮點值 (非必要) Top-P 會影響模型選取輸出符記的方式。
如要取得較不隨機的回覆,請指定較低的值;如要取得較隨機的回覆,請調高此值。詳情請參閱 Top-P。
範圍:[0.0, 1.0]
每則訊息的輸出符記數量上限 整數 (非必要) 回覆內可以生成的符記數量上限。一個符記約為四個字元。100 個符記大約對應 60 到 80 個字詞。
如要取得較短的回覆,請指定較低的值;如要取得較長的回覆,請調高此值。
正面處罰 浮點值 (非必要) 正值會懲罰已出現在產生文字中的符記,因此可提高產生更多元主題的可能性。
範圍:[-2.0, 2.0]
展示頻率處罰 浮點值 (非必要) 正值會對重複出現在產生文字中的符記加以懲罰,進而降低重複相同內容的可能性。
範圍:[-2.0, 2.0]
如果您未提供選用參數的值,SDK 會使用
Model ID
中所設定模型版本專屬參數的預設值。儲存新項目。
設定向量搜尋參數
如要定義 Vector Search 設定,ABAP 適用的 Vertex AI SDK 會使用 /GOOG/SEARCHCONF
資料表。
如要設定向量搜尋參數,請執行下列步驟:
在 SAP GUI 中執行交易代碼
/GOOG/SDK_IMG
。或者,您也可以執行交易代碼
SPRO
,然後按一下「SAP Reference IMG」。依序按一下「ABAP SDK for Google Cloud」>「基本設定」>「Vertex AI SDK:設定向量搜尋參數」。
按一下「新增項目」。
在下列欄位中輸入值:
欄位 資料類型 說明 搜尋鍵 字串 您指定的專屬名稱,用於識別搜尋設定。 Google Cloud 金鑰名稱 字串 您在驗證設定期間為驗證設定的用戶端金鑰。 Google Cloud Google Cloud 區域位置 ID 字串 您要使用的 Vertex AI 功能可用的 Google Cloud 區域位置 ID。
一般來說,您應使用離自己或目標使用者實際位置最近的地區。詳情請參閱「Vertex AI 位置」。
向量索引的部署 ID 字串 索引的部署 ID。將索引部署至端點時,您會為其指派專屬的部署 ID。 如要瞭解索引部署作業,請參閱「將向量索引部署至索引端點」。
向量索引端點 ID 字串 要部署索引的索引端點 ID。
如要瞭解索引端點,請參閱「建立向量索引端點」。
儲存新項目。
後續步驟
- 探索內建的 SAP 專用生成式 AI 示範。
- 瞭解 Vertex AI for SAP 中的生成式 AI。