本頁面說明如何在 Cloud Storage 中複製及儲存原始 VCF 檔案。儲存 VCF 檔案後,您可以使用變體轉換工具將檔案載入 BigQuery。
將資料複製到 Cloud Storage
Cloud Life Sciences 可託管公開資料集,其中包含來自 Illumina Platinum Genomes 的資料。如要將兩個 VCF 檔案從資料集複製到值區,請使用 gcloud storage cp
指令:
gcloud storage cp \ gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \ gs://BUCKET/platinum-genomes/vcf/
請將 BUCKET 改成您 Cloud Storage 值區的名稱。
從本機檔案系統複製變體
如要複製目前目錄中的本機檔案群組,請執行 gcloud storage cp
指令:
gcloud storage cp *.vcf gs://BUCKET/vcf/
請將 BUCKET 改成您 Cloud Storage 值區的名稱。
如要複製本機檔案目錄,請執行下列指令:
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive
更改下列內容:
- VCF_FILE_DIRECTORY:包含 VCF 檔案的本機目錄路徑
- BUCKET:Cloud Storage 值區名稱
若因暫時性網路問題導致發生任何失敗,您可以使用 no-clobber (-n
) 標記 (只會複製遺失的檔案) 重新執行之前的指令:
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \ --recursive --no-clobber
更改下列內容:
- VCF_FILE_DIRECTORY:包含 VCF 檔案的本機目錄路徑
- BUCKET:Cloud Storage 值區名稱
如要進一步瞭解如何將資料複製到 Cloud Storage,請參閱將 Cloud Storage 與大數據搭配使用一文。