Menyimpan file VCF mentah di Cloud Storage

Halaman ini menjelaskan cara menyalin dan menyimpan file VCF mentah di Cloud Storage. Setelah menyimpan file VCF mentah, Anda dapat menggunakan alat Variant Transforms untuk memuatnya ke BigQuery.

Menyalin data ke Cloud Storage

Cloud Life Sciences menghosting set data publik yang berisi data dari Illumina Platinum Genomes. Untuk menyalin dua file VCF dari set data ke bucket Anda, gunakan perintah gsutil cp:

gsutil cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

Ganti BUCKET dengan nama bucket Cloud Storage Anda.

Menyalin varian dari sistem file lokal

Untuk menyalin grup file lokal di direktori saat ini, jalankan perintah gsutil cp:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp *.vcf \
    gs://BUCKET/vcf/

Ganti BUCKET dengan nama bucket Cloud Storage Anda.

Untuk menyalin direktori lokal file, jalankan perintah berikut:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

Ganti kode berikut:

  • VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
  • BUCKET: nama bucket Cloud Storage Anda

Jika terjadi kegagalan karena masalah jaringan sementara, Anda dapat menjalankan kembali perintah sebelumnya menggunakan flag no-clobber (-n), yang hanya menyalin file yang hilang:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -n -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

Ganti kode berikut:

  • VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
  • BUCKET: nama bucket Cloud Storage Anda

Untuk mengetahui informasi selengkapnya tentang cara menyalin data ke Cloud Storage, baca artikel Menggunakan Cloud Storage dengan Big Data.