I dati del Cancer Genome Atlas

Il programma Cancer Genome Atlas (TCGA) è stato un impegno completo e coordinato per accelerare la comprensione delle basi molecolari del cancro tramite l'applicazione di tecnologie di analisi del genoma, inclusa la sequenziazione del genoma su larga scala. I dati generati dal programma hanno caratterizzato molecolarmente oltre 20.000 tumori primari e campioni normali corrispondenti che coprono 33 diversi tipi di cancro.

L'Institute for Systems Biology Cancer Gateway in the Cloud (ISB-CGC) fornisce l'accesso ai dati e ai metadati del TCGA nelle tabelle BigQuery per facilitare l'accesso e l'analisi. Queste tabelle raggruppano le informazioni sparse su decine di migliaia di dati TCGA XML e tabulari di accesso pubblico in un formato interrogabile in base al tipo di dati (ad esempio clinici, biospecimen, espressione genica e mutazione) per facilitare l'accesso e l'analisi.

Analogamente, ISB-CGC ha creato tabelle BigQuery per altri programmi per il cancro. consulta la documentazione dei programmi ISB-CGC.

ISB-CGC fornisce anche esempi di notebook in R e Python che vanno dalla creazione di query semplici a quelle complesse e all'analisi utilizzando le tabelle BigQuery di ISB-CGC:

Accesso a set di dati

Cartelle Cloud Storage

ISB-CGC memorizza i percorsi di spazio di archiviazione sul cloud per i dati del TCGA ospitati da Genomic Data Commons del National Cancer Institute nel set di dati BigQuery isb-cgc-bq.GDC_case_file_metadata. Consulta la documentazione TCGA ISB-CGC per scoprire come accedere a queste posizioni dei file.

Set di dati di BigQuery

Puoi accedere ai seguenti set di dati TCGA in BigQuery per esplorare i dati ed eseguire query:

Per esplorare altri set di dati sul cancro di ISB-CGC, utilizza lo strumento di ricerca BigQuery di ISB-CGC. Puoi trovare questi dati nel progetto isb-cgc-bq in Google BigQuery. Per ulteriori informazioni su ISB-CGC e sui relativi dati, consulta la documentazione di ISB-CGC.

Informazioni sui dati

Utilizzo: questo set di dati è disponibile pubblicamente per chiunque lo utilizzi ai sensi dei termini forniti dall'origine del set di dati (https://cancergenome.nih.gov/) ed è fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso del set di dati.