生成式 AI | Generative AI | Google Cloud

English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

控制台

聯絡我們免費試用

本頁面由 Cloud Translation API 翻譯而成。

選擇生成式 AI 應用程式適用的模型和基礎架構 <0x0A

瞭解哪些產品、架構和工具最適合建構生成式 AI 應用程式。下圖顯示雲端代管生成式 AI 應用程式中的常見元件。

文氏圖表：顯示生成式 AI 系統的元件

文氏圖表：顯示生成式 AI 系統的元件

應用程式代管：代管應用程式的運算資源。應用程式可使用 Google Cloud 的用戶端程式庫和 SDK與不同的 Cloud 產品通訊。
模型託管：為生成式模型提供可擴充且安全的託管服務。
模型：文字、即時通訊、圖片、程式碼、嵌入資料和多模態的生成模型。
建立基準解決方案：將模型輸出連結至可驗證且更新的資訊來源。
資料庫：儲存應用程式資料。您可以透過 SQL 查詢擴充提示，並/或使用 pgvector 等擴充功能，將資料儲存為向量嵌入，以便重複使用現有資料庫做為基礎解決方案。
儲存空間：儲存圖片、影片或靜態網頁前端等檔案。您也可以使用儲存空間來處理原始接地資料 (例如PDF 等)，之後再轉換為嵌入項目並儲存在向量資料庫中。

以下各節將逐步介紹這些元件，協助您選擇要試用的 Google Cloud 產品。

應用程式代管基礎架構

選擇要代管及提供應用程式工作負載的產品，以便呼叫生成式模型。

想要使用代管的無伺服器基礎架構嗎？

關閉

勾選

關閉

您的應用程式是否可容器化？

關閉

勾選

Kubernetes Engine

關閉

模型代管基礎架構

Google Cloud 提供多種方法來代管生成式模型，包括旗艦 Vertex AI 平台，以及可自訂且可移植的 Google Kubernetes Engine 代管服務。

使用 Gemini 且需要企業級功能，例如可擴充、安全性、資料隱私權和可觀察性

勾選

關閉

Gemini Developer API

勾選

想要採用全代管基礎架構，並搭配頂尖的生成式 AI 工具和 API 嗎？

關閉

勾選

關閉

您的模型是否需要專屬核心、舊版作業系統，或有特殊授權條款？

關閉

勾選

關閉

Kubernetes Engine

模型

Google Cloud 透過 Vertex AI 提供一組先進的基礎模型，包括 Gemini。您也可以將第三方模型部署至 Vertex AI Model Garden ，或在 GKE 、Cloud Run 或 Compute Engine 上自行主控。

要產生程式碼嗎？

關閉

勾選

Codey (Vertex AI)

關閉

是否要產生圖片？

關閉

勾選

Imagen (Vertex AI)

關閉

是否要為搜尋、分類或群組產生嵌入資料？

關閉

勾選

text-embedding (Vertex AI)

關閉

好的，你想產生文字。您是否想在文字提示中加入圖片或影片？(多模態)

關閉

勾選

Gemini (Vertex AI)

關閉

好的，只顯示文字提示。想使用 Google 最強大的旗艦機型嗎？

關閉

勾選

Gemini (Vertex AI)

關閉

將開放原始碼模型部署至： Vertex AI (Model Garden) GKE (HuggingFace)

建立基準和 RAG

為確保模型回覆內容準確且符合實際情況，請建立基準，讓生成式 AI 應用程式使用即時資料。這就是所謂的「檢索增強生成 (RAG)」。

如果您想產生以網路最新資訊為依據的內容，Gemini 模型可評估模型的知識是否足夠，或是否需要以 Google 搜尋建立基準。

您可以使用搜尋引擎的資料索引實作基準。許多搜尋引擎現在會將嵌入資料儲存在向量資料庫中，這是相似度搜尋等作業的最佳格式。 Google Cloud 提供多種向量資料庫解決方案，可用於不同用途。

注意：您可以查詢 Cloud SQL 或 Firestore 等現有資料庫，使用非向量資料庫進行歸零，並在模型提示中使用查詢結果。

您是否需要全代管的最佳化解決方案，以便支援大多數資料來源，並防止直接存取基礎嵌入資料？

關閉

勾選

Vertex AI Search

關閉

您正在為 RAG 建構搜尋引擎

您是否想使用具備類似 LlamaIndex 介面的全代管自動化調度管理系統，為 RAG 建構搜尋引擎？

關閉

勾選

Vertex AI RAG 引擎

關閉

您可以使用參考架構，為 RAG 用途建立量身打造的搜尋引擎和向量資料庫。

關閉

您需要低延遲向量搜尋、大規模服務，還是專門的最佳化向量資料庫？

關閉

勾選

Vertex AI Vector Search

關閉

您是否透過程式輔助方式存取資料 (OLTP)？是否已使用 SQL 資料庫？

關閉

勾選

想直接從資料庫使用 Google AI 模型嗎？是否需要低延遲？

勾選

關閉

AlloyDB Cloud SQL

關閉

是否有大量的分析資料集 (OLAP)？是否需要批次處理，以及人類或指令碼 (資料科學) 經常存取 SQL 資料表？

勾選

使用 API 建立基準

除了使用您自己的資料建立基準之外，許多線上服務也提供 API，可用來擷取基準資料，以便擴充模型提示。

Vertex AI Extensions (不公開預先發布版)

建立、部署及管理可將大型語言模型連結至外部系統 API 的擴充功能。

LangChain 元件

探索各種文件載入器和API 整合，用於您的生成式 AI 應用程式，從 YouTube 到 Google 學術搜尋。

在 Vertex AI 中建立基準

如果您使用的是 Vertex AI 託管的模型，可以使用 Vertex AI 搜尋、Google 搜尋或內嵌/內嵌文字，為模型回應建立基準。

開始建構

設定 Google Cloud 的開發環境

設定 LangChain

LangChain 是生成式 AI 應用程式的開放原始碼架構，可讓您在提示中加入情境，並根據模型回應採取行動。

查看程式碼範例及部署範例應用程式

查看熱門用途的程式碼範例，並部署安全、有效率、具彈性、效能高且成本效益高的生成式 AI 應用程式範例。

保留所有權利。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2025-09-12 (世界標準時間)。