Cloud Life Sciences 提供多種公開資料集,您可以免費存取這些資料集並整合到應用程式中。Google 代管這些資料集,並透過以下方法來公開提供資料:
互動式存取可在 BigQuery 主控台中進行。您可以在病例/對照與同類群組分析中探索變體識別。查詢範例可協助您順利上手。如要瞭解如何在 BigQuery 中開始使用公開資料集,請參閱「BigQuery 公開資料集」一文。
檔案存取由 Cloud Storage 提供。可用檔案格式i為 BAM、VCF 及 FASTA。請將您需要的檔案複製到本機磁碟或 Compute Engine VM,以從您慣用的生物資訊工具進行存取。如要瞭解如何開始使用 Cloud Storage,請參閱「如何使用 Cloud Storage 中的公開資料集」一文。
針對在 Google 社群託管的公開資料,每個資料提供者都可以決定其支援的存取模式。
Cloud Life Sciences 基因體公開資料集
- 1,000 個大麻屬植物基因體專案
- 1000 Genomes
- 基因體匯總資料庫 (gnomAD)
- Illumina Platinum Genomes
- 自閉症研究人員專用的 MSSNG 資料庫
- 參考基因體
- Simons 基因體多樣性專案
- 癌症基因體圖譜 (TCGA)
- 用於產生有效療法的治療性應用研究 (TARGET)
Cloud Life Sciences 註解公開資料集
在 Cloud Storage 中列出公開資料集
如果您對於在 Cloud Storage 中列出公開資料集有任何疑問,請傳送電子郵件至 gcp-public-data@google.com 與我們聯絡。
在 BigQuery 中列出公開資料集
如果您對於在 BigQuery 中列出公開資料集有任何疑問,請傳送電子郵件至 bq-public-data@google.com 與我們聯絡。