Esta página foi traduzida pela API Cloud Translation.

Introdução à otimização

A ajustar os modelos é um processo crucial para adaptar o Gemini de modo a realizar tarefas específicas com maior precisão e exatidão. A otimização de modelos funciona fornecendo a um modelo um conjunto de dados de preparação que contém um conjunto de exemplos de tarefas específicas a jusante.

Esta página oferece uma vista geral da otimização de modelos para o Gemini, descreve as opções de otimização disponíveis para o Gemini e ajuda a determinar quando cada opção de otimização deve ser usada.

Vantagens do ajuste de modelos

O ajuste de modelos é uma forma eficaz de personalizar modelos grandes para as suas tarefas. É um passo fundamental para melhorar a qualidade e a eficiência do modelo. O ajuste do modelo oferece as seguintes vantagens:

Maior qualidade para as suas tarefas específicas
Robustez do modelo aumentada
Latência e custo de inferência mais baixos devido a comandos mais curtos

Ajuste em comparação com a conceção de comandos

Criação de comandos com modelos do Gemini pré-formados: a criação de comandos é a arte de criar instruções eficazes para orientar os modelos de IA, como o Gemini, na geração dos resultados que quer. Envolve a criação de comandos que transmitem claramente a tarefa, o formato pretendido e qualquer contexto relevante. Pode usar as capacidades do Gemini com uma configuração mínima. É mais adequado para:
- Dados etiquetados limitados: se tiver uma pequena quantidade de dados etiquetados ou não puder pagar um processo de ajuste fino demorado.
- Prototipagem rápida: quando precisa de testar rapidamente um conceito ou obter um desempenho de base sem um grande investimento na otimização.
Ajuste preciso personalizado dos modelos Gemini: para resultados mais personalizados, o Gemini permite-lhe ajustar com precisão os respetivos modelos nos seus conjuntos de dados específicos. Para criar um modelo de IA que se destaque no seu domínio específico, considere a otimização. Isto envolve a preparação do modelo base no seu próprio conjunto de dados etiquetado, adaptando as respetivas ponderações à sua tarefa e dados. Pode adaptar o Gemini aos seus exemplos de utilização. O ajuste fino é mais eficaz quando:
- Tem dados etiquetados: um conjunto de dados considerável para preparação (pense em 100 exemplos ou mais), o que permite ao modelo aprender profundamente as especificidades da sua tarefa.
- Tarefas complexas ou únicas: para cenários em que as estratégias de comandos avançadas não são suficientes e um modelo personalizado para os seus dados é essencial.

Recomendamos que comece por usar comandos para encontrar o comando ideal. Em seguida, avance para a otimização (se necessário) para melhorar ainda mais os desempenhos ou corrigir erros recorrentes. Embora a adição de mais exemplos possa ser benéfica, é importante avaliar onde o modelo comete erros antes de adicionar mais dados. Os dados de alta qualidade e bem etiquetados são cruciais para um bom desempenho e são melhores do que a quantidade. Além disso, os dados que usa para o ajuste fino devem refletir a distribuição, o formato e o contexto dos comandos que o modelo vai encontrar na produção.

A otimização oferece as seguintes vantagens em relação à criação de comandos:

Permite uma personalização detalhada do modelo e resulta num melhor desempenho em tarefas específicas.
Alinhe o modelo com sintaxe personalizada, instruções e regras semânticas específicas do domínio.
Oferece resultados mais consistentes e fiáveis.
Capaz de processar mais exemplos em simultâneo.
Poupe custos na inferência removendo exemplos de poucos disparos e instruções longas nos comandos

Abordagens de aperfeiçoamento

A otimização eficiente em termos de parâmetros e a otimização total são duas abordagens para personalizar modelos grandes. Ambos os métodos têm as suas vantagens e implicações em termos de qualidade do modelo e eficiência dos recursos.

Aperfeiçoamento eficiente de parâmetros

A otimização eficiente de parâmetros, também denominada otimização de adaptadores, permite uma adaptação eficiente de modelos grandes às suas tarefas ou domínio específicos. O ajuste eficiente em termos de parâmetros atualiza um subconjunto relativamente pequeno dos parâmetros do modelo durante o processo de ajuste.

Para compreender como a Vertex AI suporta o ajuste fino e a publicação de adaptadores, pode encontrar mais detalhes no seguinte relatório técnico: Adaptação de grandes modelos de base.

Ajuste total

A otimização total atualiza todos os parâmetros do modelo, tornando-o adequado para adaptar o modelo a tarefas altamente complexas, com o potencial de alcançar uma qualidade superior. No entanto, o ajuste fino completo exige mais recursos computacionais para o ajuste e a publicação, o que leva a custos gerais mais elevados.

Ajuste eficiente de parâmetros em comparação com o ajuste fino completo

A otimização eficiente em termos de parâmetros é mais eficiente em termos de recursos e rentável em comparação com a otimização total. Usa recursos computacionais significativamente mais baixos para a preparação. Consegue adaptar o modelo mais rapidamente com um conjunto de dados mais pequeno. A flexibilidade da ajustagem eficiente em termos de parâmetros oferece uma solução para a aprendizagem de várias tarefas sem necessidade de um novo treino extensivo.

Métodos de ajuste suportados

O Vertex AI suporta o ajuste fino supervisionado para personalizar modelos fundamentais.

Ajuste supervisionado

O ajuste fino supervisionado melhora o desempenho do modelo ao ensinar-lhe uma nova capacidade. Os dados que contêm centenas de exemplos etiquetados são usados para ensinar o modelo a imitar um comportamento ou uma tarefa desejada. Cada exemplo etiquetado demonstra o que quer que o modelo produza durante a inferência.

Quando executa uma tarefa de ajuste fino supervisionado, o modelo aprende parâmetros adicionais que o ajudam a codificar as informações necessárias para realizar a tarefa pretendida ou aprender o comportamento pretendido. Estes parâmetros são usados durante a inferência. O resultado da tarefa de ajuste é um novo modelo que combina os parâmetros recém-aprendidos com o modelo original.

O ajuste fino supervisionado de um modelo de texto é uma boa opção quando o resultado do seu modelo não é complexo e é relativamente fácil de definir. A otimização precisa supervisionada é recomendada para classificação, análise de sentimentos, extração de entidades, resumo de conteúdo não complexo e escrita de consultas específicas de domínio. Para modelos de código, a otimização supervisionada é a única opção.

Modelos que suportam o ajuste fino supervisionado

Os seguintes modelos Gemini suportam a otimização supervisionada:

Para mais informações sobre a utilização do ajuste fino supervisionado com cada modelo respetivo, consulte as seguintes páginas: ajuste texto, imagem, áudio e documento.

Limitações

O ajuste fino supervisionado tem as seguintes limitações:

A otimização não é um Serviço Abrangido e está excluída do SLO de qualquer Contrato de Nível de Serviço.

O que se segue?

Para saber mais sobre a capacidade de compreensão de documentos dos modelos Gemini, consulte a vista geral da compreensão de documentos.
Para começar a otimizar, consulte o artigo Otimize os modelos do Gemini através da otimização precisa supervisionada
Para saber como a otimização precisa supervisionada pode ser usada numa solução que cria uma base de conhecimentos de IA generativa, consulte o artigo Solução de arranque rápido: base de conhecimentos de IA generativa.