Das Programm The Cancer Genome Atlas (TCGA) war eine umfassende und koordinierte Anstrengung, um das Verständnis der molekularen Grundlagen von Krebs durch die Anwendung von Genomanalyse-Technologien, einschließlich der Sequenzierung von Genomen in großem Maßstab, zu beschleunigen. Die mit dem Programm generierten Daten charakterisierten über 20.000 primäre Krebs- und dazu passende normale Proben aus 33 verschiedenen Krebsarten auf molekularer Ebene.
Das Institute for Systems Biology Cancer Gateway in the Cloud (ISB-CGC) bietet Zugriff auf TCGA-Daten und -Metadaten in BigQuery-Tabellen für einen einfachen Zugriff und eine Analyse. Diese Tabellen fassen die über Zehntausende von XML- und tabellarischen, frei zugänglichen TCGA-Daten verstreuten Informationen in einem abfragbaren Format nach Datentyp (z. B. klinisch, Bioproben, Genexpression und Mutation) zusammen und erleichtern so den Zugang und die Analyse.
ISB-CGC hat auch BigQuery-Tabellen für andere Krebsprogramme erstellt. Weitere Informationen finden Sie in der Dokumentation zu ISB-CGC-Programmen.
ISB-CGC bietet auch Notebook-Beispiele in R und Python, die von einfachen bis zu komplexen Abfrageerstellungen und -analysen mithilfe von ISB-CGC-BigQuery-Tabellen reichen:
Dataset-Zugriff
Cloud Storage-Ordner
ISB-CGC speichert Cloud-Speicherpfade zu TCGA-Daten, die vom National Cancer Institute's Genomic Data Commons gehostet werden, in dem BigQuery-Datensatz isb-cgc-bq.GDC_case_file_metadata. Informationen zum Zugriff auf diese Speicherorte finden Sie in der Dokumentation zu ISB-CGC TCGA.
BigQuery-Datasets
Zur Untersuchung und Abfrage von Daten können Sie in BigQuery auf folgende TCGA-Datasets zugreifen:
Verwenden Sie das ISB-CGC BigQuery-Suchtool, um andere ISB-CGC-Krebs-Datasets zu entdecken. Diese Daten finden Sie im Projekt isb-cgc-bq in Google BigQuery. Weitere Informationen zu ISB-CGC und dessen Daten finden Sie in der ISB-CGC-Dokumentation.
Über die Daten
Nutzung: Dieses Dataset ist öffentlich verfügbar und kann gemäß den von der Dataset-Quelle (https://cancergenome.nih.gov/) bereitgestellten Bedingungen genutzt werden. Das Dataset wird "IM IST-ZUSTAND" ohne ausdrückliche oder stillschweigende Garantie von Google bereitgestellt. Google lehnt jegliche Haftung für direkte oder indirekte Schäden ab, die aus der Nutzung des Datasets resultieren.