Le programme The Cancer Genome Atlas (TCGA) est un effort complet et coordonné pour accélérer la compréhension de la base moléculaire des cancers via l'application de technologies d'analyse génomique, parmi lesquelles le séquençage du génome à grande échelle. Les données générées à partir du programme ont caractérisé sur le plan moléculaire plus de 20 000 cancers principaux et mis en correspondance des échantillons normaux couvrant 33 types de cancers différents.
L'Institute for Systems Biology Cancer Gateway to the Cloud (ISB-CGC) permet d'accéder à des données et métadonnées TCGA dans des tables BigQuery. L'accès à ces données et leur analyse sont ainsi bien plus faciles. Ces tables permettent de consolider des dizaines de milliers de documents au format XML ou tabulaire Open Source contenant des données TCGA dans un format interrogeable par type de données (clinique, biospécimen, expression génique, mutation, etc.) pour en faciliter l'accès et l'analyse.
De la même manière, l'ISB-CGC a créé des tables BigQuery pour d'autres programmes de lutte contre le cancer. Pour obtenir la liste complète, consultez la documentation des programmes de l'ISB-CGC.
L'ISB-CGC fournit également des exemples de notebook en R et Python, pour la création de requêtes simples à très complexes et l'analyse à l'aide des tables BigQuery de l'ISB-CGC :
Accès aux ensembles de données
Dossiers Cloud Storage
L'ISB-CGC stocke les chemins d'accès Cloud Storage aux données TCGA hébergées par le Genomic Data Commons du National Cancer Institute dans l'ensemble de données BigQuery isb-cgc-bq.GDC_case_file_metadata. Veuillez consulter la documentation TCGA de l'ISB-CGC pour savoir comment accéder à l'emplacement de ces fichiers.
Ensembles de données BigQuery
Vous pouvez accéder aux ensembles de données TCGA suivants dans BigQuery pour l'exploration et l'interrogation de données.
Pour explorer d'autres ensembles de données de l'ISB-CGC concernant les cancers, utilisez l'outil de recherche BigQuery de l'ISB-CGC. Vous pouvez trouver ces données dans le projet isb-cgc-bq au sein de Google BigQuery. Pour en savoir plus sur l'ISB-CGC et ses données, consultez la documentation de l'ISB-CGC.
À propos des données
Utilisation : Cet ensemble de données est accessible au public selon les conditions définies par sa source (https://cancergenome.nih.gov/). Il est fourni "en l'état", sans aucune garantie expresse ou implicite de la part de Google. Google décline toute responsabilité pour tout dommage direct ou indirect résultant de l'utilisation de cet ensemble de données.