Cargar y consultar datos

Empieza a usar BigQuery creando un conjunto de datos, cargando datos en una tabla y consultando la tabla.


Para seguir las instrucciones paso a paso de esta tarea directamente en la Google Cloud consola, haga clic en Ayúdame:

Guíame


Antes de empezar

Para poder explorar BigQuery, debes iniciar sesión en la consolaGoogle Cloud y crear un proyecto. Si no habilitas la facturación en tu proyecto, todos los datos que subas estarán en el entorno aislado de BigQuery. El entorno aislado te permite aprender a usar BigQuery sin coste económico mientras trabajas con un conjunto limitado de funciones de BigQuery. Para obtener más información, consulta Habilitar el entorno aislado de BigQuery.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  4. Opcional: Si selecciona un proyecto, asegúrese de habilitar la API de BigQuery. La API de BigQuery se habilita automáticamente en los proyectos nuevos.
  5. Crear un conjunto de datos de BigQuery

    Usa la Google Cloud consola para crear un conjunto de datos en el que almacenar los datos. Crea el conjunto de datos en la multirregión de EE. UU. Para obtener información sobre las regiones y multirregiones de BigQuery, consulta Ubicaciones.

    1. En la Google Cloud consola, abre la página BigQuery.
    2. Ir a BigQuery
    3. En el panel Explorador, haz clic en el nombre de tu proyecto.
    4. Haz clic en Ver acciones.
    5. Selecciona Crear conjunto de datos.
    6. En la página Crear conjunto de datos, haz lo siguiente:
      1. En ID del conjunto de datos, introduce babynames.
      2. En Tipo de ubicación, selecciona Multirregión y, a continuación, elige EE. UU. (varias regiones de Estados Unidos). Los conjuntos de datos públicos se almacenan en la usubicación multirregional. Para simplificar el proceso, almacena el conjunto de datos en la misma ubicación.
      3. Deje el resto de los ajustes predeterminados como están y haga clic en Crear conjunto de datos.

    Descargar el archivo que contiene los datos de origen

    El archivo que vas a descargar contiene aproximadamente 7 MB de datos sobre nombres de bebés populares. La proporciona la Administración de la Seguridad Social de EE. UU.

    Para obtener más información sobre los datos, consulta el artículo Información general sobre nombres populares de la Administración de la Seguridad Social.

    1. Descarga los datos de la Administración de la Seguridad Social de EE. UU. abriendo la siguiente URL en una nueva pestaña del navegador:

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. Extrae el archivo.

      Para obtener más información sobre el esquema del conjunto de datos, consulta el archivo NationalReadMe.pdf del archivo ZIP.

    3. Para ver el aspecto de los datos, abre el archivo yob2024.txt. Este archivo contiene valores separados por comas para el nombre, el sexo asignado al nacer y el número de niños con ese nombre. El archivo no contiene ninguna fila de cabecera.

    4. Anota la ubicación del archivo yob2024.txt para poder encontrarlo más adelante.

    Cargar datos en una tabla

    A continuación, carga los datos en una tabla nueva.

    1. En el panel Explorador, despliega el nombre de tu proyecto.
    2. Junto al conjunto de datos babynames, haz clic en Ver acciones y selecciona Abrir.
    3. Haz clic en Crear tabla.

      A menos que se indique lo contrario, usa los valores predeterminados de todos los ajustes.

    4. En la página Crear tabla, haz lo siguiente:
      1. En la sección Fuente, en Crear tabla a partir de, selecciona Subir en la lista.
      2. En el campo Seleccionar archivo, haz clic en Examinar.
      3. Ve al archivo yob2024.txt local, ábrelo y haz clic en Abrir.
      4. En la lista Formato de archivo, elige CSV.
      5. En la sección Destino, en el campo Tabla, introduce names_2024.
      6. En la sección Schema (Esquema), haz clic en el botón Editar como texto y pega la siguiente definición de esquema en el campo de texto:
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. Haz clic en Crear tabla.

        Espera a que BigQuery cree la tabla y cargue los datos.

    Vista previa de los datos de la tabla

    Para obtener una vista previa de los datos de la tabla, sigue estos pasos:

    1. En el panel Explorador, expande tu proyecto y el conjunto de datos babynames y, a continuación, selecciona la tabla names_2024.
    2. Haga clic en la pestaña Vista previa. BigQuery muestra las primeras filas de la tabla.
    3. La pestaña de vista previa de la tabla.
    La pestaña Vista previa no está disponible para todos los tipos de tabla. Por ejemplo, la pestaña Vista previa no se muestra en las tablas ni en las vistas externas.

    Consultar datos de tablas

    A continuación, consulta la tabla.

    1. Junto a la pestaña names_2024, haz clic en opción Consulta de SQL. Se abrirá una nueva pestaña del editor.
    2. En el editor de consultas, pega la siguiente consulta. Esta consulta obtiene los cinco nombres más populares de bebés nacidos en Estados Unidos en el 2024 que se asignaron al sexo masculino al nacer.
      
        SELECT
          name,
          count
        FROM
          `babynames.names_2024`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
    3. Haz clic en Ejecutar. Los resultados se muestran en la sección Resultados de la consulta.
      Panel de resultados de la consulta

    Has consultado correctamente una tabla de un conjunto de datos público y, a continuación, has cargado tus datos de muestra en BigQuery mediante la Google Cloud consola.

    Limpieza

    Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.

    1. En la Google Cloud consola, abre la página de BigQuery.
    2. Ir a BigQuery
    3. En el panel Explorador, haz clic en el conjunto de datos babynames que has creado.
    4. Abre la opción Ver acciones y haz clic en Eliminar.
    5. En el cuadro de diálogo Eliminar conjunto de datos, confirma el comando de eliminación: escribe la palabra delete y, a continuación, haz clic en Eliminar.

    Siguientes pasos