Neste lançamento experimental, estamos oferecendo aos desenvolvedores uma ferramenta poderosa para detecção e localização de objetos em imagens e vídeos. Ao identificar e delinear objetos com caixas delimitadoras, os desenvolvedores podem desbloquear uma ampla variedade de aplicativos e aumentar a inteligência dos projetos.
Principais benefícios:
- Simples:integre recursos de detecção de objetos aos seus aplicativos com facilidade, independentemente da sua experiência em visão computacional.
- Personalizável:gere caixas delimitadoras com base em instruções personalizadas (por exemplo, "Quero ver caixas delimitadoras de todos os objetos verdes nesta imagem") sem precisar treinar um modelo personalizado.
Detalhes técnicos:
- Entrada:seu comando e as imagens ou frames de vídeo associados.
- Saída:caixas delimitadoras no formato
[y_min, x_min, y_max, x_max]
. O canto superior esquerdo é a origem. Os eixosx
ey
são horizontais e verticais, respectivamente. Os valores de coordenadas são normalizados para 0 a 1.000 em todas as imagens. - Visualização:os usuários do AI Studio vão ver caixas delimitadoras plotadas na UI. Os usuários da Vertex AI precisam visualizar as caixas delimitadoras usando um código de visualização personalizado.
Python
Instalar
pip install --upgrade google-genai
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True