Gemini 모델 매개변수 구성

Gemini 모델을 사용하여 이미지에서 텍스트를 생성하고 생성된 텍스트를 반환합니다. 이 예시에서는 모델 구성 매개변수를 설정하는 방법을 보여줍니다.

코드 샘플

Python

이 샘플을 사용해 보기 전에 Vertex AI 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 Vertex AI Python API 참고 문서를 참조하세요.

Vertex AI에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.

import base64
import vertexai

from vertexai.generative_models import GenerationConfig, GenerativeModel, Part

# TODO(developer): Update and un-comment below line
# PROJECT_ID = "your-project-id"
vertexai.init(project=PROJECT_ID, location="us-central1")

model = GenerativeModel("gemini-1.5-flash-002")

# Load example image from local storage
encoded_image = base64.b64encode(open("scones.jpg", "rb").read()).decode("utf-8")
image_content = Part.from_data(
    data=base64.b64decode(encoded_image), mime_type="image/jpeg"
)

# Generation Config
config = GenerationConfig(
    max_output_tokens=2048, temperature=0.4, top_p=1, top_k=32
)

# Generate text
response = model.generate_content(
    [image_content, "what is this image?"], generation_config=config
)
print(response.text)
# Example response:
# That's a lovely overhead shot of a rustic still life featuring blueberry scones.
# Here's a breakdown of what's in the image:
# * **Blueberry Scones:** Several freshly baked blueberry scones are arranged on
# a piece of parchment paper. They appear to be homemade and slightly crumbly.
# ...

다음 단계

다른 Google Cloud 제품의 코드 샘플을 검색하고 필터링하려면 Google Cloud 샘플 브라우저를 참조하세요.