Esta página descreve os controles de compliance do Web Grounding for Enterprise e como usar a API Web Grounding for Enterprise para gerar respostas baseadas na Web. O conteúdo indexado é um subconjunto do que está disponível na Pesquisa Google e é adequado para clientes em setores altamente regulamentados, como finanças, saúde e setor público.
Se você não precisar dos controles de compliance, use o Embasamento com a Pesquisa Google, porque ele oferece acesso a um índice da Web mais amplo.
Visão geral
O Web Grounding para Enterprise usa um índice da Web que é usado para gerar respostas com base. O índice da Web oferece suporte para:
- Processamento de ML em multirregiões dos EUA ou da Europa
- Nenhum registro de dados do cliente
- VPC Service Controls
Como nenhum dado do cliente é mantido, as chaves de criptografia gerenciadas pelo cliente (CMEK) e a transparência no acesso (AxT) não são aplicáveis.
Usar a API
Esta seção fornece exemplos de solicitações de uso da API de IA generativa Gemini 2 na Vertex AI para criar respostas com base no Gemini. Para usar a API, você precisa definir os seguintes campos:
Contents.parts.text
: a consulta de texto que os usuários querem enviar para a API.tools.enterpriseWebSearch
: quando essa ferramenta for fornecida, o Web Grounding for Enterprise poderá ser usado pelo Gemini.
Selecione um exemplo de código para saber como usar a API:
Python
Substitua as seguintes variáveis por valores:
PROJECT_NUMBER
: o número do projeto.LOCATION
: a região em que o modelo é executado.MODEL_NAME
: seu modelo.
import requests
import subprocess
import json
def generate_content_with_gemini():
"""
Sends a request to the Gemini 2.0 Flash model to generate content using Google's AI Platform.
"""
# Replace with your actual project number and model name if different.
project_id = PROJECT_NUMBER
region = LOCATION
model_name = MODEL_NAME # Or the correct model ID, including any version specifier
endpoint = f"https://{region}-aiplatform.googleapis.com/v1/projects/{project_id}/locations/{region}/publishers/google/models/{model_name}:generateContent"
# Get the access token using gcloud. Requires gcloud to be installed and configured.
try:
result = subprocess.run(["gcloud", "auth", "print-access-token"], capture_output=True, text=True, check=True)
access_token = result.stdout.strip()
except subprocess.CalledProcessError as e:
print(f"Error getting access token: {e}")
return None
headers = {
"Authorization": f"Bearer {access_token}",
"Content-Type": "application/json",
"x-server-timeout": "60" # in seconds
}
data = {
"contents": [{
"role": "user",
"parts": [{
"text": "Who won the 2024 Eurocup?"
}]
}],
"tools": [{
"enterpriseWebSearch": {
}
}]
}
try:
response = requests.post(endpoint, headers=headers, json=data)
response.raise_for_status() # Raise HTTPError for bad responses (4xx or 5xx)
return response.json()
except requests.exceptions.RequestException as e:
print(f"Request failed: {e}")
return None
# Example usage:
if __name__ == "__main__":
result = generate_content_with_gemini()
if result:
print(json.dumps(result, indent=2))
else:
print("Failed to generate content.")
curl
Substitua as seguintes variáveis por valores:
PROJECT_NUMBER
: o número do projeto.TEXT
: seu comando.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -H "x-server-timeout: 60" https://us-discoveryengine.googleapis.com/v1alpha/projects/PROJECT_NUMBER/locations/eu:generateGroundedContent -d '
{
"contents": [{
"role": "user",
"parts": [{
"text": TEXT
}]
}],
"tools": [{
"enterpriseWebSearch": {
}
}]
}
}
'
A seguir
- Para saber mais sobre como basear modelos do Gemini nos seus dados, consulte Basear nos seus dados.
- Para saber mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI, consulte IA responsável.