Uma parte essencial do método científico é registrar as observações e os parâmetros de um experimento. Na ciência de dados, também é essencial acompanhar os parâmetros, artefatos e métricas usados em um experimento de machine learning (ML). Esses metadados ajudam a:
- analisar as execuções de um sistema de ML de produção para entender as alterações na qualidade das previsões;
- analisar experimentos de ML para comparar a eficácia de diferentes conjuntos de hiperparâmetros;
- acompanhe a linhagem dos artefatos de ML, como conjuntos de dados e modelos, para entender apenas o que contribuiu para a criação de um artefato ou como esse artefato foi usado para criar artefatos descendentes.
- executar novamente um fluxo de trabalho de ML com os mesmos artefatos e parâmetros;
- rastrear o uso downstream de artefatos de ML para fins de governança.
O Vertex ML Metadata permite que você registre os metadados e artefatos produzidos pelo sistema de ML e consulte-os para ajudar a analisar, depurar e auditar o desempenho do sistema de ML ou os artefatos que ele produz.
O Vertex ML Metadata usa os conceitos usados na biblioteca de código aberto ML Metadata (MLMD), desenvolvida pela equipe do TensorFlow Extended do Google.
Visão geral dos metadados do ML do Vertex
O Vertex ML Metadata descreve os metadados do seu sistema de ML como um gráfico.
No gráfico de metadados, os artefatos e execuções são nós, e os eventos são arestas que vinculam artefatos como entradas ou saídas de execuções. Os contextos representam subgráficos que são usados para agrupar logicamente conjuntos de artefatos e execuções.
É possível aplicar metadados de pares de chave-valor a artefatos, execuções e contextos. Por exemplo, um modelo pode ter metadados que descrevem o framework usado para treinar o modelo e as métricas de desempenho, como precisão, precisão e recall.
Saiba mais sobre como rastrear os metadados do seu sistema de ML. Se você tiver interesse em analisar os metadados do Vertex AI Pipelines, confira este tutorial passo a passo.
Linhagem de artefato de ML
Para entender as alterações no desempenho do sistema de ML, você precisa analisar os metadados produzidos pelo fluxo de trabalho de ML e a linhagem dos artefatos. A linhagem de um artefato inclui todos os fatores que contribuíram para sua criação, bem como os artefatos e metadados descendentes do artefato.
Por exemplo, a linhagem de um modelo pode incluir o seguinte:
- Os dados de treinamento, teste e avaliação usados para criar o modelo.
- Os hiperparâmetros usados durante o treinamento do modelo.
- O código usado para treinar o modelo.
- Os metadados gravados do processo de treinamento e avaliação, como a acurácia do modelo.
- Artefatos descendentes desse modelo, como os resultados de predições em lote.
Ao rastrear os metadados do sistema de ML usando o Vertex ML Metadata, você pode responder a perguntas como estas:
- Qual conjunto de dados foi usado para treinar um determinado modelo?
- Quais modelos da minha organização foram treinados com um determinado conjunto de dados?
- Qual execução produziu o modelo mais preciso e quais hiperparâmetros foram usados para treiná-lo?
- Quais destinos de implantação foram de um determinado modelo implantado e quando ele foi implantado?
- Qual versão do seu modelo foi usada para criar uma previsão em um determinado momento?
Saiba mais sobre como analisar os metadados do seu sistema de ML.