Treinamento eficiente do PyTorch com dados em nuvem
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
A Pesquisa de arquitetura neural da Vertex AI não tem requisitos que descrevem como
projetar seus treinadores. Portanto, escolha qualquer framework de treinamento para criar o treinador.
Para o treinamento do PyTorch com grandes quantidades de dados, a prática recomendada é usar o paradigma de treinamento
distribuído e ler os dados do Cloud Storage.
Acesse a postagem do blog
Treinamento eficiente do PyTorch com a Vertex AI para conferir métodos sobre como melhorar o desempenho
do treinamento. É possível notar uma melhoria geral de seis vezes no desempenho com dados no
Cloud Storage usando WebDataset e escolhendo DistributedDataParallel ou
estratégias de treinamento distribuídas FullyShardedDataParallel. O desempenho
do treinamento usando dados no Cloud Storage é semelhante ao desempenho do treinamento usando dados em um disco local.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-02 UTC."],[],[],null,["# Efficient PyTorch training with cloud data\n\nVertex AI Neural Architecture Search has no requirements describing how to\ndesign your trainers. Therefore, choose any training frameworks to build the trainer.\n\nFor PyTorch training with large amounts of data, the best practice is to use the distributed training\nparadigm and to read data from Cloud Storage.\nCheck out the blog post\n[Efficient PyTorch training with Vertex AI](https://cloud.google.com/blog/products/ai-machine-learning/efficient-pytorch-training-with-vertex-ai) for methods to improve the training\nperformance. You can see an overall 6x performance improvement with data on\nCloud Storage using `WebDataset` and choosing `DistributedDataParallel` or\n`FullyShardedDataParallel` distributed training strategies. The training\nperformance using data on Cloud Storage is similar to the training performance using data on\na local disk.\n\nThe prebuilt\n[MNasNet classification example](https://github.com/google/vertex-ai-nas/blob/main/pytorch/classification/cloud_search_main.py)\nhas incorporated these methods into its training pipeline."]]