-
agente
- No contexto da IA generativa, um agente é um software que planeja e executa de forma autônoma uma série de ações para atingir uma meta, possivelmente em situações novas. Os agentes podem ser usados em vários aplicativos, como processamento de linguagem natural, machine learning e robótica. Por exemplo, um agente de LLM usa um modelo de linguagem para avaliar o ambiente e escolher uma ação que o ajude a alcançar a meta. Os agentes de LLM podem ser usados para gerar texto, traduzir idiomas e responder a perguntas.
-
Endpoint da API
- Endpoints de API é um aspecto de configuração de serviço que especifica os endereços de rede, também conhecidos como endpoints de serviço (por exemplo, aiplatform.googleapis.com).
-
Application Default Credentials (ADC)
- As Application Default Credentials (ADC) oferecem uma maneira simples de receber credenciais de autorização para uso na chamada de APIs do Google. Eles são ideais quando a chamada precisa ter o mesmo nível de identidade e autorização para o aplicativo, seja qual for o usuário. Essa é a abordagem recomendada para autorizar chamadas às APIs do Google Cloud, principalmente ao criar um aplicativo implantado em máquinas virtuais do Google App Engine (GAE) ou do Compute Engine. Para mais informações, consulte Como o Application Default Credentials funciona.
-
Vizinho mais próximo aproximado (ANN, na sigla em inglês)
- O serviço do vizinho mais próximo aproximado (ANN, na sigla em inglês) é uma solução de alta escala e baixa latência para encontrar vetores semelhantes (ou, mais especificamente, "embeddings") para um corpus grande. Para mais informações, consulte Como usar a pesquisa de vetor para correspondência semântica.
-
artifact
- Um artefato é uma entidade distinta ou parte dos dados produzidos e consumidos por um fluxo de trabalho de machine learning. Exemplos de artefatos incluem conjuntos de dados, modelos, arquivos de entrada e registros de treinamento.
-
Artifact Registry
- O Artifact Registry é um serviço universal de gerenciamento de artefatos. É o serviço recomendado para gerenciar contêineres e outros artefatos no Google Cloud. Para saber mais, consulte Artifact Registry.
-
Inteligência artificial (IA)
- A inteligência artificial (IA) é o estudo e o design de máquinas que parecem "inteligentes", ou seja, que imitam funções humanas ou intelectuais, como movimento mecânico, raciocínio ou resolução de problemas. Um dos subcampos mais conhecidos da IA é o aprendizado de máquina, que usa uma abordagem estatística e orientada por dados para criar IA. No entanto, algumas pessoas usam esses dois termos como sinônimos.
-
Realidade aumentada (RA)
- Misturar conteúdo digital renderizado com conteúdo do mundo real, seja por uma tela, como em um smartphone, ou como uma sobreposição ao mundo visto por óculos. O conteúdo digital precisa ser rastreado de acordo com o movimento da câmera ou dos óculos (dependendo de como a cena é renderizada) para que pareça fazer parte do mundo real.
-
authentication
- O processo de verificação da identidade de um cliente (que pode ser um usuário ou outro processo) para ter acesso a um sistema protegido. Um cliente que provou sua identidade é considerado autenticado. Para mais informações, consulte Métodos de autenticação no Google.
-
Avaliação lado a lado automática (AutoSxS)
- O AutoSxS é uma ferramenta de avaliação assistida por modelo que compara dois modelos de linguagem grandes (LLMs) lado a lado. Ele pode ser usado para avaliar o desempenho de modelos de IA generativa no Vertex AI Model Registry ou inferências pré-geradas. O AutoSxS usa um avaliador automático para decidir qual modelo dá a melhor resposta a um comando. A AutoSxS está disponível sob demanda e avalia modelos de linguagem com desempenho comparável ao de avaliadores humanos.
-
Reconhecimento automático de fala (ASR,conversão de voz em texto)
- Transcrição automática de linguagem falada (voz) para texto.
-
AutoML
- Algoritmos de aprendizado de máquina que "aprendem a aprender" com a otimização de caixa preta. Para mais informações, consulte o Glossário de aprendizado de máquina.
-
autorater
- Um avaliador automático é um modelo de linguagem que avalia a qualidade das respostas do modelo com base em um comando de inferência original. Ele é usado no pipeline AutoSxS para comparar as inferências de dois modelos e determinar qual deles teve o melhor desempenho. Para mais informações, consulte O avaliador automático.
-
valor de referência
- Um modelo usado como ponto de referência para comparar a performance de outro modelo (normalmente, mais complexo). Por exemplo, um modelo de regressão logística pode servir como uma boa base para um modelo de aprendizado profundo. Para um problema específico, o valor de referência ajuda os desenvolvedores de modelos a quantificar o desempenho mínimo esperado que um novo modelo precisa alcançar para ser útil. Para mais informações, consulte Conjuntos de dados de base e de destino.
-
lote
- O conjunto de exemplos usado em uma iteração de treinamento. O tamanho do lote determina o número de exemplos em um lote.
-
Tamanho do lote
- O número de exemplos em um lote. Por exemplo, o tamanho do lote do SGD é 1, enquanto o tamanho do lote de um minilote geralmente fica entre 10 e 1.000. O tamanho do lote geralmente é fixo durante o treinamento e a inferência. No entanto, o TensorFlow permite tamanhos de lote dinâmicos.
-
inferência em lote
- A inferência em lote usa um grupo de solicitações de inferência e gera os resultados em um arquivo. Para mais informações, consulte Visão geral de como receber inferências na Vertex AI.
-
vício
- 1. Estereótipos, preconceito ou favoritismo em relação a algumas coisas, pessoas ou grupos. Esses vieses podem afetar a coleta e a interpretação de dados, o design de um sistema e a forma como os usuários interagem com ele. 2. Erro sistemático introduzido por um procedimento de amostragem ou de relatório.
-
bidirecional
- Um termo usado para descrever um sistema que avalia o texto que precede e segue uma seção de texto de destino. Em contraste, um sistema unidirecional avalia apenas o texto que precede uma seção de texto de destino.
-
Representações de codificadores bidirecionais de transformadores (BERT)
- O BERT é um método de representação de linguagem pré-treinamento. Isso significa que treinamos um modelo de "compreensão de linguagem" de uso geral em um grande corpus de texto (como a Wikipédia) e usamos esse modelo para tarefas de PLN downstream que nos interessam (como responder a perguntas). O BERT supera os métodos anteriores porque é o primeiro sistema não supervisionado e profundamente bidirecional para pré-treinamento de PLN.
-
Bilingual Evaluation Understudy (BLEU)
- Uma medida popular para avaliar a qualidade de um algoritmo de tradução automática comparando a saída dele com uma ou mais traduções humanas.
-
aumento
- No treinamento de modelo, o boosting pode se referir a técnicas de aumento de dados usadas para aumentar o tamanho e a diversidade dos conjuntos de dados de treinamento. Isso é feito transformando exemplos atuais para criar outros variados, o que pode melhorar o desempenho do modelo, principalmente quando o conjunto de dados original é limitado.
-
caixa delimitadora
- Uma caixa delimitadora para um objeto no frame de vídeo pode ser especificada de duas maneiras: (i) usando dois vértices que consistem em um conjunto de coordenadas x,y se eles forem pontos diagonalmente opostos do retângulo. Por exemplo: x_relative_min, y_relative_min,,,x_relative_max,y_relative_max,, (ii) usar todos os quatro vértices. Para mais informações, consulte Preparar dados do vídeo.
-
bucket
- Pasta de nível superior do Cloud Storage. Os nomes de buckets precisam ser exclusivos para todos os usuários do Cloud Storage. Os buckets contêm arquivos. Para mais informações, consulte Visão geral do produto Cloud Storage.
-
Cadeia de pensamento
- Na IA generativa, a cadeia de pensamento (CoT) é uma técnica de comando que incentiva o modelo de linguagem grande (LLM) a detalhar explicitamente o processo de raciocínio antes de chegar a uma conclusão. Isso envolve pedir ao modelo para mostrar as etapas intermediárias que ele realiza para resolver um problema, em vez de apenas fornecer a resposta final. Esse método pode melhorar significativamente a performance do LLM em tarefas de raciocínio complexas.
-
chat
- O conteúdo de um diálogo entre duas pessoas com um sistema de ML, geralmente um modelo de linguagem grande. A interação anterior em um chat (o que você digitou e como o modelo de linguagem grande respondeu) se torna o contexto para as partes subsequentes do chat. Um chatbot é um aplicativo de um modelo de linguagem grande.
-
checkpoint
- Dados que capturam o estado dos parâmetros de um modelo durante ou após o treinamento. Por exemplo, durante o treinamento, você pode: 1. Interromper o treinamento, talvez intencionalmente ou como resultado de determinados erros. 2. Capture o checkpoint. 3. Depois, recarregue o ponto de verificação, possivelmente em um hardware diferente. 4. Reinicie o treinamento. No Gemini, um checkpoint se refere a uma versão específica de um modelo do Gemini treinado em um conjunto de dados específico.
-
modelo de classificação
- Um modelo cuja inferência é uma classe. Por exemplo, os seguintes são todos modelos de classificação: um modelo que prevê o idioma de uma frase de entrada (francês? Espanhol? italiano?). Um modelo que prevê espécies de árvores (bordo? Carvalho? Baobá?). Um modelo que prevê a classe positiva ou negativa para uma condição médica específica.
-
métricas de classificação
- As métricas de classificação suportadas no SDK da Vertex AI para Python são a matriz de confusão e a curva ROC.
-
Cloud TPU
- Um acelerador de hardware especializado projetado para agilizar cargas de trabalho de machine learning no Google Cloud.
-
clustering
- No contexto da IA generativa, o clustering é uma técnica de aprendizado de máquina não supervisionado usada para agrupar pontos de dados semelhantes com base nas características deles. Isso é feito definindo uma medida (ou métrica) de similaridade para comparar pontos de dados e agrupando aqueles com alta similaridade no mesmo cluster. Em aplicativos de IA generativa, isso pode envolver o agrupamento de embeddings (representações numéricas de texto, imagens ou outros dados) para realizar tarefas como pesquisa, classificação ou detecção de outliers. Por exemplo, a segmentação de clientes pode ser feita agrupando dados para identificar grupos com comportamentos ou características semelhantes. Para mais informações, consulte O que é clustering?.
-
imagem de contêiner
- Uma imagem de contêiner é um pacote que inclui o código executável do componente e uma definição do ambiente em que ele é executado. Para mais informações, consulte a visão geral do treinamento personalizado.
-
context
- Um contexto é usado para agrupar artefatos e execuções em uma única categoria, que pode ser consultada e digitada. Os contextos podem ser usados para representar conjuntos de metadados. Um exemplo de contexto seria uma execução de um pipeline de machine learning.
-
cache de contexto
- Um cache de contexto na Vertex AI é uma grande quantidade de dados que pode ser usada em várias solicitações para um modelo do Gemini. O conteúdo em cache é armazenado na região em que a solicitação para criar o cache é feita. Ele pode ser qualquer tipo MIME compatível com os modelos multimodais do Gemini, como texto, áudio ou vídeo. Para mais informações, consulte Visão geral do armazenamento em cache de contexto.
-
janela de contexto
- O número de tokens que um modelo pode processar em um determinado comando. Quanto maior a janela de contexto, mais informações o modelo pode usar para fornecer respostas coerentes e consistentes ao comando.
-
Chaves de criptografia gerenciadas pelo cliente (CMEK, na sigla em inglês)
- Chaves de criptografia gerenciadas pelo cliente (CMEK, na sigla em inglês) são integrações que permitem aos clientes criptografar dados em serviços atuais do Google usando uma chave que eles gerenciam no Cloud KMS (também conhecido como Storky). No Cloud KMS, a chave de criptografia de dados protege os dados. Para mais informações, consulte Chaves de criptografia gerenciadas pelo cliente (CMEK).
-
análise de dados
- Entender os dados considerando amostras, medições e visualizações. A análise de dados pode ser especialmente útil quando um conjunto de dados é recebido pela primeira vez, antes da criação do primeiro modelo. Também é essencial para entender experimentos e depurar problemas com o sistema.
-
ampliação de dados
- Aumentar artificialmente o intervalo e o número de exemplos de treinamento transformando os exemplos atuais para criar outros. Por exemplo, suponha que as imagens sejam um dos seus recursos, mas o conjunto de dados não tenha exemplos suficientes para que o modelo aprenda associações úteis. O ideal é adicionar imagens rotuladas suficientes ao conjunto de dados para permitir que o modelo seja treinado corretamente. Se isso não for possível, a ampliação de dados poderá girar, esticar e refletir cada imagem para produzir muitas variantes da foto original, gerando dados rotulados suficientes para permitir um treinamento excelente.
-
DataFrame
- Um tipo de dados pandas conhecido para representar conjuntos de dados na memória. Um DataFrame é análogo a uma tabela ou planilha. Cada coluna de um DataFrame tem um nome (um cabeçalho), e cada linha é identificada por um número exclusivo. Cada coluna em um DataFrame é estruturada como uma matriz 2D, exceto que cada coluna pode receber um tipo de dados próprio.
-
indexação de dados
- No contexto da IA generativa, a indexação de dados é o processo de estruturar e organizar uma base de conhecimento para otimizar a pesquisa e a recuperação. Isso envolve a criação de um índice, geralmente chamado de corpus, que permite uma pesquisa eficiente dos dados. O processo é separado da criação de corpus, e os dados indexados podem ser usados para enriquecer o contexto de modelos de linguagem grandes (LLMs), reduzindo alucinações e melhorando a precisão das respostas. Por exemplo, em um contexto de site, a indexação de dados pode envolver a adição de metadados, como datePublished e dateModified, para melhorar a funcionalidade de pesquisa. Existem diferentes métodos para indexar dados, incluindo o uso da pesquisa de vetor para pesquisa de similaridade em aplicativos, como a recuperação de informações relevantes para LLMs no momento da consulta. Para mais informações, consulte Visão geral do mecanismo RAG .
-
ingestão de dados
- A ingestão de dados é o processo de extrair dados de várias fontes e integrá-los em um local central para processamento e análise posteriores. No contexto da IA generativa, a ingestão de dados envolve a extração de informações de diferentes fontes de dados, como formulários clínicos, registros de pacientes ou texto não estruturado, para treinar e ajustar modelos de IA generativa. Os dados ingeridos geralmente são processados e transformados para garantir a qualidade e a consistência antes de serem usados para treinar os modelos de IA generativa. Esse processo pode envolver limpeza de dados, engenharia de atributos e técnicas de aumento de dados para melhorar o desempenho e as capacidades de generalização do modelo. Para mais informações, consulte Usar a IA generativa no gerenciamento de utilização.
-
paralelismo de dados
- Uma maneira de escalonar o treinamento ou a inferência que replica um modelo inteiro em vários dispositivos e transmite um subconjunto dos dados de entrada para cada dispositivo. O paralelismo de dados permite treinamento e inferência em tamanhos de lote muito grandes. No entanto, ele exige que o modelo seja pequeno o suficiente para caber em todos os dispositivos. O paralelismo de dados geralmente acelera o treinamento e a inferência.
-
conjunto de dados
- Um conjunto de dados é amplamente definido como uma coleção de registros de dados estruturados ou não estruturados. Uma coleção de dados brutos, geralmente (mas não exclusivamente) organizada em um dos seguintes formatos: uma planilha ou um arquivo no formato CSV (valores separados por vírgula). Para mais informações, consulte Criar um conjunto de dados
-
transformação de dados
- No contexto da geração aumentada de recuperação (RAG), a transformação de dados se refere à conversão de dados em um formato adequado para indexação e processamento por um LLM. Isso geralmente envolve dividir os dados em partes menores para facilitar a incorporação e a indexação. Outras transformações podem incluir etapas de limpeza e validação para garantir a qualidade dos dados. Para mais informações, consulte a visão geral do mecanismo RAG.
-
decoder
- Em geral, qualquer sistema de ML que converta de uma representação processada, densa ou interna para uma representação mais bruta, esparsa ou externa. Os decodificadores geralmente são um componente de um modelo maior, em que são frequentemente pareados com um codificador. Em tarefas de sequência para sequência, um decodificador começa com o estado interno gerado pelo codificador para prever a próxima sequência.
-
rede neural profunda (DNN)
- Uma rede neural com várias camadas ocultas, geralmente programada com técnicas de aprendizado profundo.
-
depth
- A soma do seguinte em uma rede neural: 1. o número de camadas ocultas; 2. o número de camadas de saída, que geralmente é um; 3. o número de camadas de embedding. Por exemplo, uma rede neural com cinco camadas ocultas e uma camada de saída tem uma profundidade de 6. A camada de entrada não influencia a profundidade.
-
DevOps
- DevOps é um conjunto de produtos do Google Cloud Platform, por exemplo, Artifact Registry e Cloud Deploy.
-
parada antecipada
- Um método de regularização que envolve encerrar o treinamento antes que a perda de treinamento termine de diminuir. Na parada antecipada, você interrompe intencionalmente o treinamento do modelo quando a perda em um conjunto de dados de validação começa a aumentar, ou seja, quando o desempenho de generalização piora.
-
embedding
- Representações numéricas de palavras ou partes de texto. Esses números captam o significado semântico e o contexto do texto. Palavras ou textos semelhantes ou relacionados costumam ter embeddings semelhantes, o que significa que estão mais próximos no espaço vetorial de alta dimensão.
-
espaço de embedding (espaço latente)
- Na IA generativa, o espaço de embedding se refere a uma representação numérica de texto, imagens ou vídeos que captura as relações entre as entradas. Os modelos de aprendizado de máquina, principalmente os de IA generativa, são adequados para criar esses embeddings identificando padrões em grandes conjuntos de dados. Os aplicativos podem usar embeddings para processar e gerar linguagem, reconhecendo significados complexos e relações semânticas específicas do conteúdo.
-
vetor de embedding
- Uma representação vetorial densa, geralmente de baixa dimensão, de um item. Assim, se dois itens forem semanticamente parecidos, os respectivos embeddings estarão próximos um do outro no espaço vetorial de embedding.
-
codificador
- Em geral, qualquer sistema de ML que converta de uma representação bruta, esparsa ou externa em uma representação mais processada, densa ou interna. Os codificadores geralmente são um componente de um modelo maior, em que são frequentemente pareados com um decodificador. Alguns transformadores combinam codificadores e decodificadores, enquanto outros usam apenas um deles. Alguns sistemas usam a saída do codificador como entrada para uma rede de classificação ou regressão. Em tarefas de sequência para sequência, um codificador recebe uma sequência de entrada e retorna um estado interno (um vetor). Em seguida, o decodificador usa esse estado interno para prever a próxima sequência.
-
ensemble
- Uma coleção de modelos treinados de forma independente cujas inferências são calculadas ou agregadas. Em muitos casos, um conjunto produz inferências melhores do que um único modelo. Por exemplo, uma floresta aleatória é um conjunto criado com várias árvores de decisão. Nem todas as florestas de decisão são conjuntos.
-
ambiente
- No aprendizado por reforço, o mundo que contém o agente e permite que ele observe o estado desse mundo. Por exemplo, o mundo representado pode ser um jogo como xadrez ou um mundo físico como um labirinto. Quando o agente aplica uma ação ao ambiente, ele faz a transição entre estados.
-
avaliação (eval)
- Uma avaliação é um tipo de experimento em que consultas registradas ou sintéticas são enviadas por duas pilhas de pesquisa: uma experimental, que inclui sua mudança, e uma básica, sem ela. As avaliações geram diferenças e métricas que permitem avaliar o impacto, a qualidade e outros efeitos da mudança nos resultados da pesquisa e em outras partes da experiência do usuário do Google. As avaliações são usadas durante o ajuste ou as iterações na sua mudança. Elas também são usadas como parte do lançamento de uma mudança no tráfego de usuários ativos.
-
execução
- Uma execução é um registro de uma etapa de fluxo de trabalho de machine learning individual, geralmente anotado com os parâmetros de ambiente de execução. Exemplos de execuções incluem ingestão, validação e treinamento de modelos, avaliação e implantação de modelos.
-
Pontuação F1
- A pontuação F1 é uma métrica usada para avaliar a acurácia da saída de um modelo. É especialmente útil para avaliar o desempenho de modelos em tarefas em que a precisão e o recall são importantes, como a extração de informações. Para modelos de IA generativa, a pontuação F1 pode ser usada para comparar as inferências do modelo com dados de informações empíricas e determinar a acurácia dele. No entanto, para tarefas generativas, como resumo e geração de texto, outras métricas, como a pontuação Rough-L, podem ser mais adequadas.
-
recurso
- Em machine learning (ML), um atributo é uma característica ou atributo de uma instância ou entidade usada como entrada para treinar um modelo de ML ou fazer inferências.
-
extração de atributos
- No contexto da IA generativa, a extração de atributos se refere ao processo de identificar e selecionar atributos relevantes dos dados de entrada para serem usados no treinamento de modelo. Esses recursos são usados para gerar novos dados semelhantes à entrada original. Por exemplo, na geração de imagens, a extração de recursos pode envolver a identificação de bordas, texturas e cores. No processamento de linguagem natural, isso pode envolver a extração de palavras-chave, frases e estruturas gramaticais. Os recursos extraídos são usados pelo modelo generativo para criar novo conteúdo.
-
disponibilização de recursos
- A exibição de atributos é o processo de exportação ou busca de valores de atributos para treinamento ou inferência. Na Vertex AI, há dois tipos de exibição de atributos: exibição on-line e exibição off-line. A disponibilização on-line recupera os valores de atributos mais recentes de um subconjunto da fonte de dados de atributos para inferências on-line. A disponibilização off-line ou em lote exporta grandes volumes de dados de atributos, incluindo dados históricos, para processamento off-line, como treinamento de modelo de ML.
-
Visualização do recurso
- Uma visualização de recursos é uma coleção lógica de recursos materializados de uma fonte de dados do BigQuery para uma instância de loja on-line. Uma visualização de recurso armazena e atualiza periodicamente os dados de recursos do cliente, que são atualizados periodicamente na origem do BigQuery. Ela é associada diretamente ao armazenamento de dados ou por associações com os recursos de registro do recurso.
-
comando de poucos disparos (few-shot)
- Na IA generativa, "few-shot" se refere a um tipo de comando que inclui um pequeno número de exemplos para orientar a resposta do modelo. Esses exemplos ajudam o modelo a entender o formato de saída, a frase, o escopo ou o padrão geral da resposta desejados. Muitas vezes, os comandos de poucos disparos são usados para regular a saída dos modelos de linguagem, garantindo que eles gerem respostas precisas, de alta qualidade e consistentes com as expectativas do usuário. Ao fornecer ao modelo alguns exemplos relevantes, o usuário pode influenciar o comportamento dele e obter resultados mais satisfatórios. Para mais informações, consulte Incluir exemplos few-shot.
-
modelo de fundação (FM)
- Modelos treinados com dados abrangentes para que possam ser adaptados (por exemplo, ajustados) a uma ampla variedade de tarefas downstream.
-
Operações de modelos de fundação (FMOPs)
- A FMOps amplia os recursos da MLOps e se concentra na produção eficiente de modelos fundamentais pré-treinados (treinados do zero) ou personalizados (ajustados).
-
Gemini
- O Gemini é um conjunto de modelos multimodais grandes baseados em sequências do Google. Isso significa que eles podem aceitar entradas e produzir saídas em mais de uma mídia por vez, incluindo texto, áudio e mídia visual. Eles foram projetados para se integrar a agentes capazes de realizar várias tarefas. Para mais informações, consulte Modelos do Google.
-
generalização
- A capacidade de um modelo de fazer inferências corretas em dados novos que nunca foram vistos antes. Um modelo que pode generalizar é o oposto de um modelo que está overfitting.
-
geração
- No contexto da IA generativa, "geração" se refere ao processo de criação de novos dados ou conteúdo com base em dados ou informações atuais. Os modelos de IA generativa são treinados em grandes conjuntos de dados e podem aprender padrões e relações neles. Depois, eles podem usar esse conhecimento para gerar conteúdo novo e exclusivo, semelhante aos dados de treinamento, mas não uma réplica exata. Para mais informações, consulte Quando usar IA generativa ou IA tradicional.
-
modelo generativo
- Um tipo de modelo de machine learning que pode criar novas saídas com base nos dados de treinamento. De maneira simples, o modelo gera novos dados que se parecem com um determinado conjunto de categorias em que ele foi treinado. Geralmente associada a modelos de linguagem grandes, mas outros tipos de modelos também podem ser generativos.
-
Sistema de modem incorporado do Google (GEMS)
- O GEMS é um framework de software incorporado destinado a modems e um conjunto de fluxos de trabalho e infraestrutura de desenvolvimento. A principal visão do GEMS é fornecer código de sistema de modem de alta qualidade com alta capacidade de reutilização em muitos dispositivos do Google que contêm modems. Para alcançar essa visão ampla, o GEMS oferece um ambiente abrangente para desenvolvedores, composto pelos principais blocos de construção mostrados abaixo.
-
gradiente
- O vetor de derivadas parciais em relação a todas as variáveis independentes. Em machine learning, o gradiente é o vetor de derivadas parciais da função do modelo. O gradiente aponta na direção da inclinação mais acentuada.
-
gráfico
- No contexto da IA generativa, um gráfico se refere a uma representação estruturada de informações que organiza e conecta dados como uma rede de nós e arestas. Esses gráficos são usados com frequência para representar conhecimento e relações entre entidades, o que os torna particularmente úteis para sistemas de IA generativa que exigem um entendimento profundo do contexto e das relações nos dados. Os sistemas de IA generativa que usam grafos de conhecimento podem aproveitar esses recursos para melhorar o desempenho dos modelos de recuperação. Ao incorporar mapas de informações ao sistema, a IA generativa pode acessar dados ricos em contexto e percorrer o mapa para recuperar subgrafos relevantes com base nas consultas do usuário. Isso permite que o sistema forneça respostas mais precisas e informativas, gerando conteúdo contextualmente relevante.
-
informações empíricas (GT)
- Informações empíricas são um termo usado em vários campos para se referir à verdade absoluta de algum problema de decisão ou medição, em vez da estimativa de algum sistema. Em machine learning, o termo "informações empíricas" se refere ao conjunto de treinamento para técnicas de aprendizado supervisionado.
-
alucinação
- Uma alucinação na IA generativa é uma resposta confiante de uma IA que não pode ser fundamentada pelos dados de treinamento. Ele pode estar incorreto. No contexto da geração de texto, são falsidades aleatórias que parecem plausíveis no conteúdo de texto gerado.
-
heurística
- Uma solução simples e rápida para um problema. Por exemplo, "Com uma heurística, alcançamos 86% de acurácia. Quando mudamos para uma rede neural profunda, a acurácia aumentou para 98%".
-
camada oculta
- Uma camada em uma rede neural entre a camada de entrada (os atributos) e a camada de saída (a inferência). Cada camada oculta consiste em um ou mais neurônios. Uma rede neural profunda tem mais de uma camada oculta.
-
histogram
- Uma exibição gráfica da variação em um conjunto de dados usando barras. Um histograma visualiza padrões que são difíceis de detectar em uma tabela simples de números.
-
hiperparâmetro
- Um hiperparâmetro é uma variável que controla o processo de treinamento de um modelo de machine learning. Essas variáveis podem incluir taxas de aprendizado, valores de momentum no otimizador e o número de unidades na última camada oculta de um modelo. Para mais informações, consulte Visão geral do ajuste de hiperparâmetros.
-
ajuste de hiperparâmetros
- O ajuste de hiperparâmetros na Vertex AI envolve a execução de vários testes de um aplicativo de treinamento com valores diferentes para os hiperparâmetros escolhidos, definidos dentro dos limites especificados. O objetivo é otimizar as configurações de hiperparâmetros para maximizar a acurácia preditiva do modelo. Para mais informações, consulte Visão geral do ajuste de hiperparâmetros.
-
Permissões do Identity and Access Management (IAM)
- As permissões do Identity and Access Management (IAM) são recursos granulares específicos que definem quem pode fazer o quê em quais recursos do Google Cloud. Eles são atribuídos a principais (como usuários, grupos ou contas de serviço) por meio de papéis, permitindo o controle preciso do acesso a serviços e dados em um projeto ou organização do Google Cloud. Para mais informações, consulte Controle de acesso com o IAM.
-
Imagen
- O Imagen é um serviço de IA generativa de texto para imagem disponível na plataforma Vertex AI. Ele permite que os usuários gerem imagens novas, editem imagens, ajustem modelos de estilo ou assunto, legendem imagens ou recebam respostas para perguntas sobre o conteúdo da imagem. Para mais informações, consulte a Visão geral do Imagen na Vertex AI.
-
reconhecimento de imagem
- O reconhecimento de imagens é o processo de classificação de objetos, padrões ou conceitos em uma imagem. Também é conhecida como classificação de imagens. O reconhecimento de imagens é uma subárea do machine learning e da visão computacional.
-
index
- Índice: um conjunto de vetores implantados juntos para a pesquisa por similaridade. Os vetores podem ser adicionados a um índice ou removidos dele. As consultas de pesquisa de similaridade são emitidas para um índice específico e pesquisam os vetores nesse índice.
-
inferência
- No contexto da plataforma Vertex AI, a inferência se refere ao processo de execução de pontos de dados em um modelo de machine learning para calcular uma saída, como uma única pontuação numérica. Esse processo também é conhecido como "operar um modelo de machine learning" ou "colocar um modelo de machine learning em produção". A inferência é uma etapa importante no fluxo de trabalho de machine learning, porque permite que os modelos sejam usados para fazer inferências sobre novos dados. Na Vertex AI, a inferência pode ser realizada de várias maneiras, incluindo inferência em lote e on-line. A inferência em lote envolve a execução de um grupo de solicitações de inferência e a geração dos resultados em um arquivo, enquanto a inferência on-line permite inferências em tempo real em pontos de dados individuais.
-
recuperação de informações (IR)
- A recuperação de informações (IR, na sigla em inglês) é um componente essencial da Vertex AI para Pesquisa. É o processo de encontrar e recuperar informações relevantes de uma grande coleção de dados. No contexto da Vertex AI, a RI é usada para recuperar documentos de um corpus com base na consulta de um usuário. A Vertex AI oferece um conjunto de APIs para ajudar você a criar seus próprios aplicativos de geração aumentada de recuperação (RAG) ou seu próprio mecanismo de pesquisa. Para mais informações, consulte Usar a Vertex AI para Pesquisa como um back-end de recuperação usando o mecanismo RAG.
-
Infraestrutura como código (IaC)
- Infraestrutura como código. Uma abordagem para gerenciar a infraestrutura de TI em que as equipes podem gerenciar e provisionar serviços por código. Com a IaC, são criados arquivos de configuração que contêm as especificações da infraestrutura, o que facilita a criação e edição em grande escala.
-
Taxa de aprendizado (tamanho da etapa)
- A taxa de aprendizado é um hiperparâmetro usado para ajustar o processo de otimização de um modelo de machine learning. Ela determina o tamanho da etapa em que o modelo atualiza os pesos durante o treinamento. Uma taxa de aprendizado mais alta pode levar a uma convergência mais rápida, mas pode resultar em instabilidade ou overfitting. Por outro lado, uma taxa de aprendizado mais baixa pode levar a uma convergência mais lenta, mas ajuda a evitar o overfitting. Para mais informações, consulte Visão geral do ajuste de hiperparâmetros.
-
perda (custo)
- Durante o treinamento de um modelo supervisionado, uma medida da distância entre a inferência de um modelo e o rótulo. Uma função de perda calcula a perda.
-
Conjunto de dados gerenciado
- Um objeto de conjunto de dados criado e hospedado pela Vertex AI.
-
model
- Qualquer modelo pré-treinado ou não. Em geral, qualquer construção matemática que processe dados de entrada e retorne uma saída. Em outras palavras, um modelo é o conjunto de parâmetros e a estrutura necessários para que um sistema faça inferências.
-
destilação de modelo (destilação de conhecimento, modelos professor-aluno)
- A destilação de modelos é uma técnica que permite que um modelo estudante menor aprenda com um modelo professor maior. O modelo estudante é treinado para imitar a saída do modelo professor e pode ser usado para gerar novos dados ou fazer inferências. A destilação de modelos é usada com frequência para tornar modelos grandes mais eficientes ou acessíveis a dispositivos com recursos limitados. Também pode ser usado para melhorar a generalização dos modelos, reduzindo o overfitting.
-
Model Monitoring
- O Vertex AI Model Monitoring é um serviço que avalia continuamente a performance dos modelos implantados detectando desvios de recursos e deslocamentos nas solicitações de previsão, ajudando a manter a qualidade do modelo ao longo do tempo. Para mais informações, consulte Introdução ao Vertex AI Model Monitoring.
-
nome do recurso do modelo
- O nome do recurso de um
model
é o seguinte:projects/<PROJECT_ID>/locations/<LOCATION_ID>/models/<MODEL_ID>
. O ID do modelo pode ser encontrado no console do Cloud, na página "Registro de modelos".
- O nome do recurso de um
-
Network File System (NFS)
- Um sistema cliente/servidor que permite aos usuários acessar arquivos em uma rede e tratá-los como se estivessem em um diretório de arquivos local. Para mais informações, consulte Ativar um compartilhamento de NFS para treinamento personalizado.
-
codificação one-hot
- A codificação one-hot representa cada categoria como um vetor de N elementos (em que N é o número de categorias) com exatamente um elemento tendo um valor de 1,0 e todos os elementos restantes tendo um valor de 0,0. Para mais informações, consulte Codificação one-hot.
-
comando one-shot
- Um comando que contém um exemplo demonstrando como o modelo de linguagem grande deve responder. Para mais informações, consulte comando único.
-
parâmetro
- Os parâmetros são valores de entrada com chave que configuram uma execução, regulam o comportamento dela e afetam os resultados. Exemplos incluem taxa de aprendizado, taxa de desistência e número de etapas de treinamento.
-
perplexidade
- A perplexidade é uma métrica usada para avaliar o desempenho de modelos de linguagem. Ela mede a probabilidade de o modelo gerar uma determinada sequência de texto com base na distribuição do texto em que foi treinado. A perplexidade é uma métrica usada com frequência para avaliar modelos de linguagem e comparar o desempenho de diferentes modelos ou acompanhar o progresso de um modelo durante o treinamento.
-
pipeline
- Os pipelines de ML são fluxos de trabalho de ML portáteis e escalonáveis baseados em contêineres. Para mais informações, consulte Introdução ao Vertex AI Pipelines.
-
pipeline job
- Um job ou uma execução de pipeline corresponde ao recurso "PipelineJob" na API Vertex AI. É uma instância de execução da definição do pipeline de ML, que é definida como um conjunto de tarefas de ML interconectadas por dependências de entrada/saída.
-
execução de pipeline
- Um ou mais PipelineJobs do Vertex podem ser associados a um experimento em que cada PipelineJob é representado como uma única execução. Nesse contexto, os parâmetros da execução são inferidos pelos parâmetros do PipelineJob. As métricas são inferidas dos artefatos do system.Metric produzidos por esse PipelineJob. Os artefatos da execução são inferidos dos artefatos produzidos pelo PipelineJob.
-
acesso privado a serviços
- O acesso privado a serviços é uma conexão privada entre sua rede de nuvem privada virtual (VPC) e redes de propriedade do Google ou de provedores de serviços terceirizados. Ele permite que instâncias de máquina virtual (VM) na sua rede VPC se comuniquem com esses serviços usando endereços IP internos, evitando a exposição à Internet pública. Para mais informações, consulte Acesso a serviços privados.
-
comando
- Um comando é um pedido em linguagem natural enviado a um modelo de linguagem para receber uma resposta. Os comandos podem conter perguntas, instruções, informações contextuais, exemplos few-shot e entrada parcial para que o modelo conclua ou continue. Depois que o modelo recebe um comando, dependendo do tipo de modelo usado, ele pode gerar texto, embeddings, código, imagens, vídeos, músicas e mais. Para mais informações, consulte Visão geral das estratégias de solicitação.
-
engenharia de comando (design de comando)
- A engenharia de comandos em IA generativa é o processo de criação de comandos eficazes para extrair as respostas desejadas de modelos de linguagem grandes (LLMs). É um processo iterativo e orientado por testes focado em refinar entradas para alcançar resultados específicos. Isso envolve considerar o conteúdo e a estrutura do comando para garantir respostas precisas e de alta qualidade. A engenharia de comando eficaz é crucial para tarefas complexas, mesmo que as mais simples não exijam isso. O objetivo é criar protótipos rapidamente de aplicativos baseados em LLM. Para mais informações, consulte Introdução à engenharia de comandos.
-
ajuste de comandos
- O ajuste de comandos é um método de ajuste refinado com eficiência de parâmetros usado para melhorar o desempenho de um modelo de IA generativa em uma tarefa específica. Isso envolve aprender um "prefixo" que é adicionado ao comando real, às vezes em todas as camadas. Essa abordagem é considerada mais barata e rápida do que outros métodos de ajuste, geralmente gerando bons resultados. O ajuste de comandos é particularmente eficaz quando você tem uma tarefa específica e quer que o modelo a execute de uma determinada maneira. Às vezes, também é chamado de aprendizado por comandos ou ajuste (refinado) eficiente de parâmetros. Para mais informações, consulte Introdução à engenharia de comandos.
-
Capacidade de processamento provisionada (PT)
- A capacidade de processamento provisionada (PT) é um serviço premium para os modelos de IA generativa da Vertex AI que oferece uma experiência garantida com garantia de capacidade e preços previsíveis. Ao contrário da opção de pagamento conforme o uso (sob demanda), a PT permite que os clientes comprem uma cota dedicada, garantindo que as solicitações não concorram com outras pela capacidade do modelo. A PT é uma assinatura mensal ou semanal de custo fixo que reserva capacidade de processamento para modelos e locais especificados. Para mais informações, consulte Visão geral da capacidade de processamento provisionada.
-
quantization
- A quantização é uma técnica de otimização de modelos usada para reduzir a precisão dos números usados para representar os parâmetros de um modelo. Isso pode levar a modelos menores, menor consumo de energia e redução da latência de inferência.
-
Floresta aleatória
- A floresta aleatória é um algoritmo de aprendizado de máquina usado para classificação e regressão. Não é um modelo de IA generativa em si, mas um componente que pode ser usado em um sistema maior de IA generativa. Uma floresta aleatória consiste em várias árvores de decisão, e a inferência dela é uma agregação das inferências dessas árvores individuais. Por exemplo, em uma tarefa de classificação, cada árvore "vota" em uma classe, e a inferência final é a classe com mais votos. Para mais informações, consulte Floresta de decisão.
-
Cluster do Ray na Vertex AI
- Um cluster do Ray na Vertex AI é um cluster gerenciado de nós de computação que pode ser usado para executar aplicativos distribuídos de machine learning (ML) e Python. Ele fornece a infraestrutura para realizar computação distribuída e processamento paralelo para seu fluxo de trabalho de ML. Os clusters Ray são integrados à Vertex AI para garantir a disponibilidade de capacidade para cargas de trabalho essenciais de ML ou durante os períodos de pico. Ao contrário dos jobs personalizados, em que o serviço de treinamento libera o recurso após a conclusão do job, os clusters Ray permanecem disponíveis até serem excluídos. Para mais informações, consulte Visão geral do Ray na Vertex AI.
-
Ray na Vertex AI (RoV)
- O Ray na Vertex AI foi projetado para que você possa usar o mesmo código aberto Ray para escrever programas e desenvolver aplicativos na Vertex AI com alterações mínimas. Para mais informações, consulte Visão geral do Ray na Vertex AI.
-
SDK do Ray na Vertex AI para Python
- O SDK do Ray na Vertex AI para Python é uma versão do SDK da Vertex AI para Python que inclui a funcionalidade do Ray Client, do conector do Ray para BigQuery, do gerenciamento de clusters do Ray na Vertex AI e das inferências na Vertex AI. Para mais informações, consulte Introdução ao SDK da Vertex AI para Python.
-
recall
- Recall: a porcentagem de verdadeiros vizinhos mais próximos retornados pelo índice. Por exemplo, se uma consulta de vizinho mais próxima de 20 vizinhos mais próximos retornou 19 dos vizinhos mais próximos, o recall será de 19/20x100 = 95%.
-
sistema de recomendação
- Um sistema de recomendação é um sistema baseado em machine learning que ajuda os usuários a encontrar conteúdo atraente em um grande corpus. Ele gera um subconjunto menor de candidatos de um corpus potencialmente enorme, pontua e classifica os candidatos e reclassifica a classificação final para considerar restrições adicionais. Para mais informações, consulte Visão geral dos sistemas de recomendação.
-
regularização
- A regularização é uma técnica usada para evitar o overfitting em modelos de machine learning. O overfitting ocorre quando um modelo aprende muito bem os dados de treinamento, resultando em um desempenho ruim com dados não vistos. Um tipo específico de regularização mencionado é a parada antecipada, em que o treinamento é interrompido antes que a perda em um conjunto de dados de validação comece a aumentar, indicando um declínio no desempenho de generalização. Para mais informações, consulte Overfitting: regularização L2.
-
conta de serviço
- As contas de serviço são contas especiais do Google Cloud usadas por aplicativos ou máquinas virtuais para fazer chamadas de API autorizadas para os serviços do Google Cloud. Ao contrário das contas de usuário, elas não estão vinculadas a uma pessoa, mas atuam como uma identidade para seu código, permitindo acesso seguro e programático aos recursos sem exigir credenciais humanas. Para mais informações, consulte Visão geral das contas de serviço.
-
agente de serviço
- Um agente de serviço se refere a uma conta serviço gerenciado pelo Google. Ele é usado quando um serviço precisa acessar recursos criados por outro serviço. Por exemplo, quando os serviços do Dataflow ou do Dataproc precisam criar instâncias durante a execução ou quando uma função do Cloud quer usar o Key Management Service (KMS) para se proteger. Os agentes de serviço são criados automaticamente pelo Google Cloud quando um serviço os exige. Eles são usados normalmente para gerenciar o acesso a recursos e realizar várias tarefas em nome do serviço. Para mais informações, consulte Agentes de serviço.
-
Métricas de resumo
- As métricas de resumo são um valor único para cada chave de métrica de uma execução de experimento. Por exemplo, a precisão de um experimento é a precisão calculada com base em um conjunto de dados de teste no final do treinamento, que pode ser capturado como uma única métrica de resumo de valor.
-
TensorBoard
- O TensorBoard é um pacote de aplicativos da Web para visualizar e entender modelos e execuções do TensorFlow. Para mais informações, consulte TensorBoard.
-
Instância do TensorBoard
- Uma instância do TensorBoard é um recurso regionalizado que armazena Experimentos do TensorBoard da Vertex AI associados a um projeto. É possível criar várias instâncias do TensorBoard em um projeto, por exemplo, quando você quer várias instâncias ativadas para CMEK. Esse recurso é igual ao recurso TensorBoard na API.
-
Nome do recurso do TensorBoard
- Um nome de recurso do TensorBoard é usado para identificar totalmente uma instância do TensorBoard da Vertex AI. O formato é o seguinte: projects/PROJECT_ID_OR_NUMBER/locations/REGION/tensorboards/TENSORBOARD_INSTANCE_ID.
-
ajuste de tempo
- O ajuste de horário é relativo ao início de um vídeo.
-
métricas de série temporal
- As métricas de série temporal são valores de métrica longitudinais em que cada valor representa uma etapa na parte da rotina de treinamento de uma execução. As métricas de séries temporais são armazenadas no TensorBoard da Vertex AI. O Vertex AI Experiments armazena uma referência ao recurso Vertex TensorBoard.
-
token
- Um token em um modelo de linguagem é a unidade atômica que o modelo usa para treinar e fazer inferências, ou seja, palavras, morfemas e caracteres. Em domínios fora dos modelos de linguagem, os tokens podem representar outros tipos de unidades atômicas. Por exemplo, em visão computacional, um token pode ser um subconjunto de uma imagem. Para mais informações, consulte Listar e contar tokens.
-
trajetória
- Uma "trajetória" se refere a uma sequência de etapas ou ações realizadas por um agente ou modelo. Ela é usada com frequência na avaliação de modelos generativos, em que a capacidade do modelo de gerar texto, código ou outro conteúdo é avaliada. Há vários tipos de métricas de trajetória que podem ser usadas para avaliar modelos generativos, incluindo correspondência exata, em ordem, em qualquer ordem e precisão de trajetória. Essas métricas medem a similaridade entre a saída do modelo e um conjunto de saídas de referência geradas por humanos.
-
Transformer
- Um "Transformer" é uma arquitetura de rede neural que embasa a maioria dos modelos generativos mais modernos. Ele é usado em vários aplicativos de modelo de linguagem, incluindo tradução. Os transformadores consistem em um codificador e um decodificador. O codificador converte o texto de entrada em uma representação intermediária, e o decodificador converte isso em uma saída útil. Eles usam um mecanismo de autoatenção para coletar o contexto das palavras ao redor da palavra que está sendo processada. Embora o treinamento de um Transformer exija muitos recursos, o ajuste fino de um Transformer pré-treinado para aplicações específicas é mais eficiente.
-
Aprendizado por reforço do Transformer
- O aprendizado por reforço com transformadores (TRL) se refere à aplicação de técnicas de aprendizado por reforço (RL) para treinar modelos baseados em transformadores para tarefas generativas. Essa abordagem resolve as limitações dos modelos generativos tradicionais, que geralmente são treinados na inferência do próximo token sem otimização explícita para qualidades desejáveis, como coerência, segurança e sensibilidade. O TRL otimiza diretamente o modelo de linguagem em objetivos complexos usando o aprendizado por reforço, muitas vezes incorporando feedback humano (RLHF) para orientar o processo de aprendizado. Por exemplo, o ajuste de modelos para gerar conteúdo menos tóxico usando modelos de recompensa e o uso da TRL para ajustar a Gemma, um modelo generativo. Para mais informações, consulte DLCs do Hugging Face: ajuste fino da Gemma com aprendizado por reforço de transformadores (TRL) na Vertex AI.
-
verdadeiro positivo
- Um "verdadeiro positivo" se refere a uma inferência em que o modelo identifica corretamente uma classe positiva. Por exemplo, se um modelo for treinado para identificar clientes que vão comprar uma jaqueta, um verdadeiro positivo seria prever corretamente que um cliente fará essa compra.
-
validação
- A validação verifica a qualidade das inferências de um modelo em relação ao conjunto de validação. Isso envolve definir métricas para medir a qualidade, a velocidade, a adesão às instruções e a segurança do conteúdo gerado. A validação geralmente usa dados rotulados (comandos de entrada e saídas esperadas) para comparar as inferências do modelo com as informações empíricas. Métricas como a pontuação F1 (para classificação) e ROUGE-L (para resumo) podem ser usadas. O processo também inclui testes de casos extremos e cenários incomuns para garantir a robustez. Para modelos implantados, o monitoramento contínuo e a captura de pontos de dados comuns e casos extremos ajudam a melhorar os esforços de validação futuros.
-
vetor
- Um vetor se refere a uma representação numérica de texto, imagens ou vídeos que captura as relações entre as entradas. Os modelos de machine learning são adequados para criar embeddings identificando padrões em grandes conjuntos de dados. Os aplicativos podem usar embeddings para processar e produzir linguagem, reconhecendo significados complexos e relações semânticas específicas do conteúdo. Para mais informações, consulte Visão geral das APIs de embeddings.
-
Experimentos da Vertex AI
- Com os experimentos da Vertex AI, os usuários podem acompanhar: 1. Etapas de uma execução do experimento (por exemplo, pré-processamento e treinamento). 2. Entradas (por exemplo, algoritmo, parâmetros e conjuntos de dados). 3. Resultados dessas etapas (por exemplo, modelos, pontos de controle e métricas).
-
Vertex AI Model Registry
- O Vertex AI Model Registry é um repositório central em que é possível gerenciar o ciclo de vida dos seus modelos de ML. No Vertex AI Model Registry, você tem uma visão geral dos seus modelos para organizar, rastrear e treinar melhor as novas versões. Quando houver uma versão de modelo que você gostaria de implantar, será possível atribuí-la a um endpoint diretamente do registro ou, usando aliases, implantar modelos em um endpoint. Para mais informações, consulte Introdução ao Vertex AI Model Registry.
-
trecho de vídeo
- Um trecho de vídeo é identificado pelo deslocamento de início e término de um vídeo.
-
nuvem privada virtual (VPC)
- A nuvem privada virtual é um pool configurável de recursos de computação compartilhados sob demanda, alocado em um ambiente de nuvem pública e que oferece um nível de isolamento entre diferentes organizações que usam esses recursos.
-
incorporação de palavras
- Os embeddings de palavras são uma maneira de representar palavras como vetores densos de valores de ponto flutuante. Isso permite que palavras semelhantes tenham codificações semelhantes. Os embeddings de palavras são usados com frequência na IA generativa para capturar as relações entre palavras e gerar novos textos ou códigos, sem fontes. Na IA generativa, os embeddings de palavras podem ser usados para treinar modelos que geram novos textos ou códigos. Ao entender as relações entre as palavras, os modelos de IA generativa podem criar conteúdo novo, coerente e relevante.
-
comando zero-shot (comando direto)
- Na IA generativa, um comando zero-shot permite que um modelo de linguagem grande (LLM) execute uma tarefa sem treinamento ou exemplos adicionais. Isso contrasta com métodos como o comando de poucos disparos, que fornece ao modelo exemplos de entradas e saídas. Um comando zero-shot depende apenas do conhecimento preexistente do modelo para gerar uma resposta. Para mais informações, consulte comando de aprendizado sem exemplos.