Introdução aos ajustes

O ajuste de modelos é um processo crucial na adaptação do Gemini para executar tarefas específicas com maior precisão. O ajuste de modelos fornece um modelo com um conjunto de dados de treinamento que contém um conjunto de exemplos de tarefas downstream específicas.

Nesta página, você encontra uma visão geral do ajuste de modelos para o Gemini, uma descrição das opções disponíveis e ajuda para determinar quando cada opção de ajuste precisa ser usada.

Benefícios do ajuste de modelos

O ajuste de modelos é uma maneira eficaz de personalizar modelos grandes para suas tarefas. Essa é uma etapa fundamental para melhorar a qualidade e a eficiência do modelo. O ajuste de modelos oferece os seguintes benefícios:

  • Qualidade mais alta para suas tarefas específicas
  • Maior robustez de modelo
  • Menor latência e custo de inferência devido a comandos mais curtos

Ajuste comparado ao design de comandos

  • Comandos com modelos pré-treinados do Gemini: o comando é a arte de criar instruções eficazes para orientar modelos de IA, como o Gemini, na geração das respostas que você quer. Ela envolve criar comandos que transmitam claramente a tarefa, o formato desejado e qualquer contexto relevante. Você pode usar os recursos do Gemini com configuração mínima. Ele é mais adequado para:
    • Dados rotulados limitados: se você tiver uma pequena quantidade de dados rotulados ou não puder arcar com um processo de ajuste fino longo.
    • Prototipagem rápida: quando você precisa testar rapidamente um conceito ou ter uma performance de referência sem um grande investimento em ajuste fino.
  • Ajuste personalizado dos modelos do Gemini: para resultados mais personalizados, o Gemini permite ajustar os modelos com base nos seus conjuntos de dados específicos. Para criar um modelo de IA que se destaque no seu domínio específico, considere o ajuste fino. Isso envolve treinar novamente o modelo de base no seu próprio conjunto de dados rotulado, adaptando os pesos dele à sua tarefa e aos seus dados. Você pode adaptar o Gemini aos seus casos de uso. O ajuste fino é mais eficaz quando:
    • Você tem dados rotulados: um conjunto de dados considerável para treinamento (pense em 100 exemplos ou mais), o que permite que o modelo aprenda profundamente as especificidades da sua tarefa.
    • Tarefas complexas ou exclusivas: para cenários em que estratégias de comandos avançados não são suficientes e um modelo adaptado aos seus dados é essencial.

Recomendamos começar com comandos para encontrar o ideal. Em seguida, passe para o ajuste fino (se necessário) para aumentar ainda mais a performance ou corrigir erros recorrentes. Embora adicionar mais exemplos possa ser benéfico, é importante avaliar onde o modelo erra antes de adicionar mais dados. Dados de alta qualidade e bem rotulados são cruciais para uma boa performance e melhores do que a quantidade. Além disso, os dados usados para ajuste fino precisam refletir a distribuição, o formato e o contexto do comando que o modelo vai encontrar na produção.

O ajuste oferece os seguintes benefícios em relação ao design de comandos:

  • Permite uma personalização profunda no modelo e resulta em melhor desempenho em tarefas específicas.
  • Alinhar o modelo com sintaxe personalizada, instruções e regras semânticas específicas do domínio.
  • Oferece resultados mais consistentes e confiáveis.
  • Capaz de processar mais exemplos de uma só vez.
  • Economize custos na inferência removendo exemplos de poucos disparos e instruções longas nos comandos

Abordagens de ajuste

O ajuste com eficiência de parâmetros e o ajuste fino completo são duas abordagens para personalizar modelos grandes. Ambos os métodos têm vantagens e implicações em termos de qualidade do modelo e eficiência de recursos.

O ajuste da eficiência dos parâmetros

O ajuste da eficiência de parâmetros, também chamado de ajuste do adaptador, permite a adaptação eficiente de modelos grandes para tarefas ou domínios específicos. O ajuste eficiente de parâmetros atualiza um subconjunto relativamente pequeno de parâmetros do modelo durante o processo de ajuste.

Para entender como a Vertex AI oferece suporte ao ajuste e à disponibilização de adaptadores, confira mais detalhes neste artigo: Adaptação de modelos de fundação grandes.

Ajuste completo

O ajuste completo atualiza todos os parâmetros do modelo, o que o torna adequado para adaptá-lo a tarefas altamente complexas, com o potencial de alcançar maior qualidade. No entanto, o ajuste fino completo exige recursos computacionais mais altos para ajuste e disponibilização, levando a custos gerais mais altos.

O ajuste da eficiência dos parâmetros em comparação com o ajuste fino completo

O ajuste com eficiência de parâmetros é mais econômico em comparação com o ajuste fino completo. Ele usa recursos computacionais significativamente menores para treinamento. Ele adapta o modelo mais rapidamente com um conjunto de dados menor. A flexibilidade do ajuste de eficiência de parâmetros oferece uma solução para o aprendizado de várias tarefas sem a necessidade de um retreinamento extensivo.

Métodos de ajuste com suporte

A Vertex AI oferece suporte ao ajuste fino supervisionado para personalizar modelos de fundação.

Ajuste de detalhes supervisionado

O ajuste de detalhes supervisionado melhora o desempenho do modelo ensinando uma nova habilidade. Dados que contêm centenas de exemplos rotulados são usados para ensinar o modelo a imitar um comportamento ou tarefa desejado. Cada exemplo rotulado demonstra o que você quer que o modelo produza durante a inferência.

Ao executar um job de ajuste, o modelo aprende outros parâmetros que o ajudam a codificar as informações necessárias para executar a tarefa desejada ou aprender o comportamento desejado. Esses parâmetros são usados durante a inferência. A saída do job de ajuste é um novo modelo que combina os parâmetros recém-aprendidos com o modelo original.

O ajuste de detalhes supervisionado de um modelo de texto é uma boa opção quando a saída do modelo não é complexa e é relativamente fácil de definir. O ajuste de detalhes supervisionado é recomendado para classificação, análise de sentimento, extração de entidade, resumo de conteúdo não complexo e gravação de consultas específicas de domínio. Para modelos de código, o ajuste supervisionado é a única opção.

Modelos com suporte para ajuste supervisionado

Os seguintes modelos do Gemini são compatíveis com ajuste supervisionado:

Para mais informações sobre como usar o ajuste de detalhes supervisionado em cada modelo, consulte as seguintes páginas: ajuste os tipos de dados texto, imagem, áudio e documento.

A seguir