O conjunto de dados 1000 Genomes abrange aproximadamente 2.500 genomas de 25 populações de todo o mundo. Consulte o site do projeto 1000 Genomes e as seguintes publicações para mais detalhes:
Publicação piloto: um mapa integrado de variação genética de 1.092 genomas humanos
Publicação da Fase I: um mapa da variação do genoma humano com base no sequenciamento da escala populacional
Publicações da Fase III:
Acesso ao conjunto de dados
Pastas do Cloud Storage
Os arquivos a seguir estão disponíveis no bucket genomics-public-data
do Cloud Storage:
- Dados do 1000 Genomes: gs://genomics-public-data/1000-genomes
- Dados da Fase 3 do 1000 Genomes: gs://genomics-public-data/1000-genomes-phase-3
- Um espelhamento completo do https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ disponível em gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/ (links em inglês)
Conjuntos de dados do BigQuery
Para conhecer e consultar os dados nos conjuntos de dados do BigQuery, acesse:
- Variantes da fase 3: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Informações de amostra: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- Descendência: bigquery-public-data: human_genome_variants.1000_genomes_pedigree
Sobre o conjunto de dados
Origem do conjunto de dados:
- O conjunto de dados de variantes da Fase 1 é hospedado pelo site de FTP da EBI (links em inglês).
- O conjunto de dados de variantes da Fase 3 é hospedado pelo site de FTP da EBI.
Uso: esses conjuntos de dados estão disponíveis ao público conforme os termos fornecidos pela fonte do conjunto de dados (http://www.internationalgenome.org/data [em inglês]) e são concedidos "NO ESTADO EM QUE SE ENCONTRAM", sem garantia expressa ou implícita do Google. O Google isenta-se de qualquer responsabilidade por quaisquer danos, diretos ou indiretos, decorrentes do uso dos conjuntos de dados.