Introdução aos ajustes

O ajuste de modelos é o processo de adaptação do Gemini para realizar tarefas downstream específicas com maior precisão e acurácia. O ajuste de modelos fornece um modelo com um conjunto de dados de treinamento que contém exemplos de tarefas downstream específicas.

Nesta página, você encontra uma visão geral do ajuste de modelos para o Gemini, abordando os seguintes tópicos:

Benefícios do ajuste de modelos

O ajuste de modelos é uma maneira eficaz de personalizar modelos grandes para suas tarefas. Essa é uma etapa fundamental para melhorar a qualidade e a eficiência de um modelo. O ajuste de modelos oferece os seguintes benefícios:

  • Qualidade mais alta: melhora o desempenho do modelo nas suas tarefas específicas.
  • Maior robustez do modelo: torna o modelo mais resiliente a variações na entrada.
  • Menor custo e latência de inferência: reduz custos e tempos de resposta ao permitir comandos mais curtos.

Ajuste comparado ao design de comandos

A tabela a seguir compara o design de comandos e o ajuste refinado:

Método Descrição Ideal para
Design de comandos Criar instruções eficazes para orientar a saída do modelo sem mudar o modelo em si. Prototipagem rápida, tarefas com dados rotulados limitados ou quando você precisa de uma performance de base rapidamente.
Ajuste de detalhes Retreinar o modelo de base em um conjunto de dados rotulado personalizado para adaptar os pesos a uma tarefa específica. Tarefas complexas ou exclusivas, para alcançar maior qualidade e quando você tem um conjunto de dados considerável (mais de 100 exemplos).

Ao decidir entre o design de comandos e o ajuste refinado, considere as seguintes recomendações:

  • Comece com o design de comandos para encontrar o ideal. Se necessário, use o ajuste refinado para melhorar ainda mais a performance ou corrigir erros recorrentes.
  • Antes de adicionar mais dados, avalie onde o modelo comete erros.
  • Priorize dados de alta qualidade e bem rotulados em vez de quantidade.
  • Verifique se os dados usados para ajuste fino refletem a distribuição, o formato e o contexto do comando que o modelo vai encontrar na produção.

O ajuste oferece os seguintes benefícios em relação ao design de comandos:

  • Personalização mais profunda: oferece uma personalização mais profunda do modelo, resultando em melhor desempenho em tarefas específicas.
  • Melhor alinhamento: alinha o modelo com sintaxe, instruções e regras semânticas específicas do domínio personalizadas.
  • Resultados mais consistentes: oferece resultados mais consistentes e confiáveis.
  • Processa mais exemplos: processa mais exemplos em um único comando.
  • Custo de inferência reduzido: economiza custos na inferência ao eliminar a necessidade de exemplos de poucos disparos e instruções longas em comandos.

Abordagens de ajuste

O ajuste com eficiência de parâmetros e o ajuste fino completo são duas abordagens para personalizar modelos grandes. Ambos os métodos têm vantagens e implicações para a qualidade do modelo e a eficiência de recursos.

Abordagem de ajuste Descrição Prós Contras
Ajuste com eficiência de parâmetros (ajuste por adaptadores) Atualiza apenas um pequeno subconjunto dos parâmetros do modelo. Eficiente em termos de recursos, econômico, treinamento mais rápido com conjuntos de dados menores, flexível para aprendizado multitarefa. Pode não atingir a mesma qualidade máxima do ajuste completo para tarefas altamente complexas.
Ajuste de detalhes completo Atualiza todos os parâmetros do modelo. Potencial para maior qualidade em tarefas altamente complexas. Exige muitos recursos computacionais e custos mais altos para ajuste e disponibilização.

O ajuste com eficiência de parâmetros (PET), também chamado de ajuste do adaptador, atualiza um pequeno subconjunto dos parâmetros do modelo. Essa abordagem é mais eficiente em termos de recursos e econômica do que o ajuste fino completo. Ele adapta o modelo mais rapidamente com um conjunto de dados menor e oferece uma solução flexível para o aprendizado de várias tarefas sem retreinamento extensivo. Para entender como a Vertex AI oferece suporte ao ajuste e à disponibilização de adaptadores, consulte o artigo Adaptação de modelos de fundação grandes.

O ajuste fino completo atualiza todos os parâmetros do modelo. Esse método é adequado para adaptar um modelo a tarefas altamente complexas e pode alcançar maior qualidade. No entanto, ele exige muitos recursos computacionais para ajuste e disponibilização, o que aumenta os custos gerais.

Métodos de ajuste com suporte

A Vertex AI oferece suporte ao ajuste fino supervisionado para personalizar modelos de fundação.

Ajuste de detalhes supervisionado

O ajuste de detalhes supervisionado melhora o desempenho de um modelo ensinando uma nova habilidade usando um conjunto de dados com centenas de exemplos rotulados. Cada exemplo rotulado demonstra a saída desejada que você quer que o modelo produza durante a inferência.

Ao executar um job de ajuste supervisionado, o modelo aprende outros parâmetros que codificam as informações necessárias para realizar a tarefa desejada ou aprender o comportamento desejado. Esses parâmetros são usados durante a inferência. A saída do job de ajuste é um novo modelo que combina os parâmetros recém-aprendidos com o modelo original.

O ajuste de detalhes supervisionado de um modelo de texto é uma boa opção quando a saída do modelo não é complexa e é relativamente fácil de definir. O ajuste de detalhes supervisionado é uma boa opção para tarefas como classificação, análise de sentimento, extração de entidades, resumo de conteúdo não complexo e gravação de consultas específicas de domínio. Para modelos de código, o ajuste supervisionado é a única opção.

Modelos com suporte para ajuste de detalhes supervisionado

Os seguintes modelos do Gemini são compatíveis com ajuste supervisionado:

Para mais informações sobre o ajuste refinado supervisionado com diferentes tipos de dados, consulte como ajustar modelos usando dados de texto, imagem, áudio e documento.

A seguir