透過 Google Cloud 控制台載入及查詢資料
瞭解如何使用 Google Cloud 控制台建立資料集、將範例資料載入 BigQuery 資料表,以及查詢資料表。
如要直接在 Google Cloud 控制台按照逐步指南操作,請按一下「Guide me」(逐步引導):
事前準備
您必須先登入Google Cloud 控制台並建立專案,才能探索 BigQuery。如果未在專案中啟用帳單功能,則您上傳的所有資料都會進入 BigQuery 沙箱模式。沙箱可讓您免付費使用部分 BigQuery 功能,藉此熟悉 BigQuery 的操作方式。詳情請參閱「啟用 BigQuery 沙箱」。- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
- 選用:如果您選取現有專案,請務必啟用 BigQuery API。新專案會自動啟用 BigQuery API。
建立 BigQuery 資料集
透過 Google Cloud 控制台建立資料集來儲存資料。
- 在 Google Cloud 控制台開啟「BigQuery」頁面。 前往 BigQuery
- 在
「Explorer」 窗格,點按專案名稱。 - 按一下 「查看動作」。
- 選取「Create dataset」(建立資料集)。
- 在「Create dataset」頁面上執行下列操作:
- 在「Dataset ID」(資料集 ID) 中輸入
babynames
。 - 在「位置類型」中選取「多區域」,然後選擇「美國 (多個美國區域)」。
公開資料集儲存在
us
多地區位置。為簡單起見,請將資料集儲存在相同位置。 - 保留其餘預設設定,然後按一下
「Create dataset」(建立資料集) 。
下載來源資料檔案
您下載的檔案包含約 7 MB 的熱門新生兒命名資料。這項資料是由美國社會安全局提供。如要進一步瞭解資料集,請參閱 美國社會安全保障局的資料集資訊頁面。
在新的瀏覽器分頁中開啟下列網址,以下載美國社會安全局的資料集:
https://www.ssa.gov/OACT/babynames/names.zip
將檔案解壓縮。
如要進一步瞭解資料集結構定義,請參閱 ZIP 檔案中的
NationalReadMe.pdf
檔案。如要查看資料樣貌,請開啟
yob2014.txt
檔案。這個逗號分隔值檔案內含名字、出生時判定的性別,以及同名的新生兒人數,這個檔案沒有標題列。請記下
yob2014.txt
檔的位置,以便稍後尋找。
將資料載入資料表
接著,請將資料載入新資料表。
- 在
「Explorer」 窗格,點按專案名稱。 - 在 babynames 資料集旁邊,按一下 「View actions」(查看動作),然後選取「Open」(開啟)。
- 按一下
除非另有指示,否則請保留所有設定的預設值。
「建立資料表」。 - 在「Create table」頁面中執行下列操作:
- 在「Source」(來源) 部分中,從
「Create table from」(建立資料表來源) 清單中選擇「Upload」(上傳)。 - 在「Select file」(選取檔案) 欄位,點按「Browse」(瀏覽)。
- 找到並開啟本機中的
yob2014.txt
檔案,然後點按「Open」(開啟)。 - 從
「File format」(檔案格式) 清單選擇「CSV」。 - 在「Destination」(目的地) 部分的
「Table」(資料表) 欄位,輸入names_2014
。 - 在「Schema」(結構定義) 部分,點按
「Edit as text」(以文字形式編輯) 切換按鈕,然後將下列結構定義貼入文字欄位: 點按
「Create table」(建立資料表) 。等待 BigQuery 建立資料表並載入資料。BigQuery 載入資料後,請展開
「Personal history」(個人記錄) 和「Project history」(專案記錄) 窗格,查看工作詳細資料。
name:string,assigned_sex_at_birth:string,count:integer
預覽資料表資料
如要預覽資料表資料,請按照下列步驟操作:
- 在
「Explorer」 窗格,展開專案和babynames
資料集,然後選取names_2014
資料表。 - 點按
「Preview」(預覽) 分頁標籤,BigQuery 會顯示資料表的前幾個資料列。

查詢資料表資料
接著是查詢資料表。相關程序與先前提到的範例雷同,只不過這次查詢的是您的資料表,而不是公開資料表。
- 在詳細資料窗格中,按一下 「SQL 查詢」。系統會開啟新的編輯器分頁。
- 將下列查詢貼入查詢編輯器,這項查詢會擷取 2014 年美國前五名熱門男嬰 (出生時判定為男性) 名字。
SELECT name, count FROM `babynames.names_2014` WHERE assigned_sex_at_birth = 'M' ORDER BY count DESC LIMIT 5;
- 按一下
「Run」(執行) 。結果會顯示於「Query results」(查詢結果) 部分。
您已成功使用 Google Cloud 控制台查詢公開資料集內的資料表,並將範例資料載入 BigQuery。
清除所用資源
如要避免系統向您的 Google Cloud 帳戶收取您在本頁所用資源的費用,請按照下列步驟操作。
- 在 Google Cloud 控制台開啟「BigQuery」頁面。 前往 BigQuery
- 在「Explorer」窗格中,按一下您建立的
babynames
資料集。 - 展開 「View actions」 選項,然後按一下「Delete」。
- 在「Delete dataset」對話方塊中,確認刪除指令:輸入字詞
delete
,然後按一下「Delete」。
後續步驟
- 如要進一步瞭解如何使用 Google Cloud 控制台,請參閱使用 Google Cloud 控制台的相關說明。
- 如要進一步瞭解如何將資料載入至 BigQuery,請參閱「載入資料簡介」一文。
- 要進一步瞭解如何查詢資料,請參閱「查詢 BigQuery 資料總覽」一文。
- 如要瞭解如何使用巢狀和重複的資料載入 JSON 檔案,請參閱載入巢狀和重複的 JSON 資料。
- 如要進一步瞭解如何透過程式存取 BigQuery,請參閱 REST API 參考資料,或前往 BigQuery 用戶端程式庫頁面。