在 Cloud Storage 中儲存原始 VCF 檔案

本頁面說明如何在 Cloud Storage 中複製及儲存原始 VCF 檔案。儲存 VCF 檔案後,您可以使用變體轉換工具將檔案載入 BigQuery。

將資料複製到 Cloud Storage

Cloud Life Sciences 可託管公開資料集,其中包含來自 Illumina Platinum Genomes 的資料。如要將兩個 VCF 檔案從資料集複製到值區,請使用 gcloud storage cp 指令:

gcloud storage cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

請將 BUCKET 改成您 Cloud Storage 值區的名稱。

從本機檔案系統複製變體

如要複製目前目錄中的本機檔案群組,請執行 gcloud storage cp 指令:

gcloud storage cp *.vcf gs://BUCKET/vcf/

請將 BUCKET 改成您 Cloud Storage 值區的名稱。

如要複製本機檔案目錄,請執行下列指令:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive

更改下列內容:

  • VCF_FILE_DIRECTORY:包含 VCF 檔案的本機目錄路徑
  • BUCKET:Cloud Storage 值區名稱

若因暫時性網路問題導致發生任何失敗,您可以使用 no-clobber (-n) 標記 (只會複製遺失的檔案) 重新執行之前的指令:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \
    --recursive --no-clobber

更改下列內容:

  • VCF_FILE_DIRECTORY:包含 VCF 檔案的本機目錄路徑
  • BUCKET:Cloud Storage 值區名稱

如要進一步瞭解如何將資料複製到 Cloud Storage,請參閱將 Cloud Storage 與大數據搭配使用一文。