Nesta página, você encontra orientações sobre como otimizar a performance em buckets com namespace hierárquico ativado.
Como listar objetos
Confira a seguir as considerações de desempenho para listar objetos:
- Em buckets com namespace hierárquico ativado, listar todos os objetos do bucket inteiro ou com um prefixo exige muitos recursos, já que a operação precisa percorrer cada pasta e subpasta, semelhante ao comando
ls -r
em um sistema de arquivos. Consequentemente, quanto mais pastas houver no bucket, mais lenta será a listagem de objetos. Um grande número de pastas vazias também pode afetar negativamente o desempenho da listagem de objetos. Para evitar um impacto negativo no desempenho, recomendamos que você maximize o número de objetos em cada pasta e exclua regularmente as pastas vazias. - Listar ou recuperar objetos e subpastas em uma pasta específica usando um delimitador e um prefixo específico é mais eficiente em buckets com namespace hierárquico ativado, já que os objetos são organizados em uma estrutura de pastas. Para otimizar a performance das informações do produto ao usar um delimitador e um prefixo específico, defina o parâmetro
includeFoldersAsPrefixes
. Caso contrário, o Cloud Storage realiza outras verificações para excluir pastas vazias, o que pode deixar a operação mais lenta. Para mais informações sobre como usar oincludeFoldersAsPrefixes
ao listar objetos, consulte Como listar objetos.
Gerenciamento de pastas
Para uma gestão eficiente de pastas, recomendamos o seguinte:
- Pré-criação da estrutura de pastas:em vez de depender da criação automática de pastas durante as operações de upload, reescrita e composição de objetos, use a operação de criação de pastas para obter a estrutura desejada com antecedência. A pré-criação da estrutura de pastas melhora a consistência e a previsibilidade do desempenho.
- Maximize a proporção de objetos por pasta:procure uma proporção alta de objetos por pasta, já que isso reduz a sobrecarga associada à criação e ao gerenciamento de pastas.
- Limite as solicitações de criação e exclusão de pastas:criar ou excluir pastas exige mais recursos do que trabalhar com objetos individuais devido à natureza hierárquica. Para garantir um desempenho tranquilo, o Cloud Storage limita essas operações a 1.000 solicitações por segundo para cada bucket. As solicitações que excedem esse limite não são explicitamente restritas, mas a disponibilidade de recursos determina se elas podem ser processadas com êxito.
Exclua pastas vazias regularmente:elas podem se acumular, principalmente ao usar o gerenciamento do ciclo de vida de objetos ou excluir objetos sem excluir explicitamente as pastas principais. As pastas acumuladas podem afetar a performance da operação de listagem de objetos e outras operações relacionadas a pastas. Confira a seguir alguns dos métodos que podem ser usados para excluir pastas vazias:
- Ao usar o Cloud Storage FUSE ou o conector do Cloud Storage para interagir com um bucket ativado com namespace hierárquico, a exclusão de um diretório exclui a pasta correspondente no bucket.
- É possível usar uma exclusão recursiva para excluir pastas automaticamente ao usar o console Google Cloud ou a Google Cloud CLI.
Você pode usar um script ou um processo automatizado para excluir pastas vazias periodicamente. O script a seguir oferece uma abordagem básica para excluir pastas vazias. O script exclui pastas sequencialmente, o que pode ser lento para buckets grandes. Por isso, considere otimizar o script para ambientes de produção. Além disso, o script exclui todas as pastas vazias (criadas implícita ou explicitamente), incluindo pastas gerenciadas e as políticas do IAM associadas. Se você precisar manter pastas específicas e gerenciadas, ajuste o script com base nos recursos que quer manter.
# List all the folders under <bucket>/<prefix> and export results into # folders.txt gcloud storage folders list gs://<bucket>/<prefix> | grep storage_url | sed 's/storage_url: //' > folders.txt # Reverse the folder list and export results into folders-reverse.txt sed '1!G;h;$!d' folders.txt > folders-reverse.txt # Try deleting each folder in the reverse order (to guarantee child # folders are deleted before parent folders). This will fail for # non-empty folders, so only empty folders will be deleted xargs -I{} gcloud storage folders delete "{}" < folders-reverse.txt