Cloud Life Sciences fornisce una serie di set di dati pubblici a cui puoi accedere gratuitamente e integrare nelle tue applicazioni. Google ospita questi set di dati, fornendo l'accesso pubblico ai dati tramite i seguenti metodi:
L'accesso interattivo è disponibile nella console BigQuery. Puoi esplorare le chiamate alle varianti nelle analisi di caso/controllo e di coorte. Esistono query di esempio per aiutarti a iniziare. Per informazioni su come iniziare a utilizzare i set di dati pubblici in BigQuery, consulta Set di dati pubblici di BigQuery.
L'accesso ai file è disponibile in Cloud Storage. I file sono disponibili nei formati BAM, VCF e FASTA. Copia i file di cui hai bisogno sul tuo disco locale o su una VM Compute Engine per accedervi dai tuoi strumenti di bioinformatica preferiti. Per informazioni su come iniziare a utilizzare Cloud Storage, consulta Come utilizzare i set di dati pubblici su Cloud Storage.
Per i dati pubblici ospitati dalla community su Google, ogni fornitore di dati determina le modalità di accesso supportate.
Set di dati pubblici genomici di Cloud Life Sciences
- Progetto 1000 Cannabis Genomes
- 1000 Genomes
- Database di aggregazione del genoma (gnomAD)
- Illumina Platinum Genomes
- Database MSSNG per la ricerca sull'autismo
- Genomi di riferimento
- Simons Genome Diversity Project
- The Cancer Genome Atlas (TCGA)
- Therapeutically Applicable Research to Generate Effective Treatments (TARGET)
Set di dati pubblici di Cloud Life Sciences per l'annotazione
Elenca il tuo set di dati pubblico su Cloud Storage
Se hai domande sull'elenco di un set di dati pubblico su Cloud Storage, contattaci all'indirizzo gcp-public-data@google.com.
Elenca il tuo set di dati pubblico su BigQuery
Se hai domande sull'elenco di un set di dati pubblico in BigQuery, contattaci all'indirizzo bq-public-data@google.com.