透過 Google Cloud 控制台載入及查詢資料

瞭解如何使用 Google Cloud 控制台建立資料集、將範例資料載入 BigQuery 資料表,以及查詢資料表。


如要直接在 Google Cloud 控制台按照逐步指南操作,請按一下「Guide me」(逐步引導)

逐步引導


事前準備

您必須先登入Google Cloud 控制台並建立專案,才能探索 BigQuery。如果未在專案中啟用帳單功能,則您上傳的所有資料都會進入 BigQuery 沙箱模式。沙箱可讓您免付費使用部分 BigQuery 功能,藉此熟悉 BigQuery 的操作方式。詳情請參閱「啟用 BigQuery 沙箱」。

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  4. 選用:如果您選取現有專案,請務必啟用 BigQuery API。新專案會自動啟用 BigQuery API。

建立 BigQuery 資料集

透過 Google Cloud 控制台建立資料集來儲存資料。

  1. 在 Google Cloud 控制台開啟「BigQuery」頁面。
  2. 前往 BigQuery
  3. 「Explorer」窗格,點按專案名稱。
  4. 按一下 「查看動作」
  5. 選取「Create dataset」(建立資料集)
  6. 在「Create dataset」頁面上執行下列操作:
    1. 在「Dataset ID」(資料集 ID) 中輸入 babynames
    2. 在「位置類型」中選取「多區域」,然後選擇「美國 (多個美國區域)」。 公開資料集儲存在 us 多地區位置。為簡單起見,請將資料集儲存在相同位置。
    3. 保留其餘預設設定,然後按一下「Create dataset」(建立資料集)

下載來源資料檔案

您下載的檔案包含約 7 MB 的熱門新生兒命名資料。這項資料是由美國社會安全局提供。

如要進一步瞭解資料集,請參閱 美國社會安全保障局的資料集資訊頁面

  1. 在新的瀏覽器分頁中開啟下列網址,以下載美國社會安全局的資料集:

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. 將檔案解壓縮。

    如要進一步瞭解資料集結構定義,請參閱 ZIP 檔案中的 NationalReadMe.pdf 檔案。

  3. 如要查看資料樣貌,請開啟 yob2014.txt 檔案。這個逗號分隔值檔案內含名字、出生時判定的性別,以及同名的新生兒人數,這個檔案沒有標題列。

  4. 請記下 yob2014.txt 檔的位置,以便稍後尋找。

將資料載入資料表

接著,請將資料載入新資料表。

  1. 「Explorer」窗格,點按專案名稱。
  2. babynames 資料集旁邊,按一下 「View actions」(查看動作),然後選取「Open」(開啟)
  3. 按一下 「建立資料表」

    除非另有指示,否則請保留所有設定的預設值。

  4. 在「Create table」頁面中執行下列操作:
    1. 在「Source」(來源) 部分中,從「Create table from」(建立資料表來源) 清單中選擇「Upload」(上傳)
    2. 在「Select file」(選取檔案) 欄位,點按「Browse」(瀏覽)
    3. 找到並開啟本機中的 yob2014.txt 檔案,然後點按「Open」(開啟)
    4. 「File format」(檔案格式) 清單選擇「CSV」
    5. 在「Destination」(目的地) 部分的「Table」(資料表) 欄位,輸入 names_2014
    6. 在「Schema」(結構定義) 部分,點按「Edit as text」(以文字形式編輯) 切換按鈕,然後將下列結構定義貼入文字欄位:
    7. name:string,assigned_sex_at_birth:string,count:integer
    8. 點按「Create table」(建立資料表)

      等待 BigQuery 建立資料表並載入資料。BigQuery 載入資料後,請展開「Personal history」(個人記錄) 和「Project history」(專案記錄) 窗格,查看工作詳細資料。

預覽資料表資料

如要預覽資料表資料,請按照下列步驟操作:

  1. 「Explorer」窗格,展開專案和 babynames 資料集,然後選取 names_2014 資料表。
  2. 點按「Preview」(預覽) 分頁標籤,BigQuery 會顯示資料表的前幾個資料列。
  3. 資料表預覽畫面。
分頁標籤不適用於所有表格類型。舉例來說,外部資料表或檢視畫面不會顯示「Preview」分頁。

查詢資料表資料

接著是查詢資料表。相關程序與先前提到的範例雷同,只不過這次查詢的是您的資料表,而不是公開資料表。

  1. 在詳細資料窗格中,按一下 「SQL 查詢」。系統會開啟新的編輯器分頁。
  2. 將下列查詢貼入查詢編輯器,這項查詢會擷取 2014 年美國前五名熱門男嬰 (出生時判定為男性) 名字。
    
        SELECT
          name,
          count
        FROM
          `babynames.names_2014`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
  3. 按一下「Run」(執行)。結果會顯示於「Query results」(查詢結果) 部分。
    命名查詢結果。

您已成功使用 Google Cloud 控制台查詢公開資料集內的資料表,並將範例資料載入 BigQuery。

清除所用資源

如要避免系統向您的 Google Cloud 帳戶收取您在本頁所用資源的費用,請按照下列步驟操作。

  1. 在 Google Cloud 控制台開啟「BigQuery」頁面。
  2. 前往 BigQuery
  3. 在「Explorer」窗格中,按一下您建立的 babynames 資料集。
  4. 展開 「View actions」 選項,然後按一下「Delete」
  5. 在「Delete dataset」對話方塊中,確認刪除指令:輸入字詞 delete,然後按一下「Delete」

後續步驟