本頁面由 Cloud Translation API 翻譯而成。

使用結構定義自動偵測功能

結構定義自動偵測

啟用結構定義自動偵測功能後，BigQuery 就能推導 CSV、JSON 或 Google 試算表資料的結構定義。無論是要將資料載入至 BigQuery 或是查詢外部資料來源，您都可以使用結構定義自動偵測功能。

啟用自動偵測功能後，BigQuery 會推斷每個資料欄的資料類型。BigQuery 會在資料來源中隨機選取檔案，並掃描最多前 500 列的資料，做為代表性樣本。BigQuery 接著會檢查每個欄位，並嘗試根據樣本中的值為各欄位指派資料類型。如果資料欄中的所有資料列都為空白，自動偵測功能會將資料欄的預設值設為 STRING 資料類型。

如果您未針對 CSV、JSON 或 Google 試算表資料啟用結構定義自動偵測功能，則必須在建立資料表時手動提供結構定義。

您不需要為 Avro、Parquet、ORC、Firestore 匯出或 Datastore 匯出檔案啟用結構定義自動偵測功能。這些檔案格式是自述式，因此 BigQuery 會自動根據來源資料推論資料表結構定義。針對 Parquet、Avro 和 Orc 檔案，您可以選擇提供明確的結構定義來覆寫推斷的結構定義。

您可以透過下列方式查看資料表的結構定義偵測結果：

使用 Google Cloud 控制台。
使用 bq 指令列工具的 bq show 指令。

當 BigQuery 偵測到結構定義時，可能會在極少數情況下更改欄位名稱，這是為了要配合 GoogleSQL 的語法。

如需資料類型轉換的資訊，請參閱以下內容：

在從 Datastore 載入資料時進行資料類型轉換
在從 Firestore 載入資料時進行資料類型轉換
Avro 轉換
Parquet 轉換
ORC 轉換

使用結構定義自動偵測功能載入資料

如要在載入資料時啟用結構定義自動偵測功能，請使用下列任一方法：

在 Google Cloud 主控台的「Schema」(結構定義) 區段中，針對「Auto detect」(自動偵測)，勾選「Schema and input parameters」(結構定義和輸入參數) 選項。
在 bq 指令列工具中，使用 bq load 指令搭配 --autodetect 參數。

啟用結構定義自動偵測功能後，BigQuery 會盡可能嘗試自動推導 CSV 和 JSON 檔案的結構定義。自動偵測邏輯會讀取前 500 列資料，推論結構定義欄位類型。如果有 --skip_leading_rows 標記，系統會略過前導線。欄位類型會根據擁有最多欄位的資料列。因此，只要每個資料欄/欄位至少有一列資料含有值，自動偵測功能就會正常運作。

結構定義自動偵測功能不適用於 Avro 檔案、Parquet 檔案、ORC 檔案、Firestore 匯出檔案或 Datastore 匯出檔案。您將這些檔案載入至 BigQuery 時，系統會透過自述式來源資料自動擷取資料表結構定義。

如何在載入 JSON 和 CSV 資料時使用結構定義自動偵測功能：

主控台

前往 Google Cloud 控制台的「BigQuery」頁面。

前往 BigQuery
在「Explorer」面板中展開專案並選取資料集。
展開「動作」選項，然後按一下「開啟」。
在詳細資料面板中，按一下「Create table」(建立資料表) 圖示。
在「Create table」(建立資料表) 頁面的「Source」(來源) 區段中：
- 在「Create table from」(使用下列資料建立資料表) 部分，選取您想要的來源類型。
- 在「Source」(來源) 欄位中，瀏覽檔案/Cloud Storage 值區，或輸入 Cloud Storage URI。請注意， Google Cloud 主控台中無法加入多個 URI，但支援使用萬用字元。Cloud Storage 值區的位置必須與待建立資料表所在的資料集位置相同。
- 在「File format」(檔案格式) 部分，選取 [CSV] 或 [JSON]。
在「Create table」(建立資料表) 頁面的「Destination」(目的地) 區段中：
- 在「Dataset name」(資料集名稱) 部分選擇適當的資料集。
- 在「Table name」(資料表名稱) 欄位中，輸入您建立資料表時所使用的名稱。
- 確認「Table type」(資料表類型) 已設為「Native table」(原生資料表)。
點選「建立資料表」。

bq

發出 bq load 指令並搭配使用 --autodetect 參數。

(選用) 提供 --location 旗標，並將值設為您的位置。

下方指令會使用結構定義自動偵測功能載入檔案：

bq --location=LOCATION load \
--autodetect \
--source_format=FORMAT \
DATASET.TABLE \
PATH_TO_SOURCE

更改下列內容：

LOCATION：您所在位置的名稱。--location 是選用旗標。舉例來說，如果您在東京地區使用 BigQuery，請將該旗標的值設為 asia-northeast1。您可以使用 .bigqueryrc 檔案設定位置的預設值。
FORMAT：NEWLINE_DELIMITED_JSON 或 CSV。
DATASET：資料集包含您要載入資料的資料表。
TABLE：您要載入資料的資料表名稱。
PATH_TO_SOURCE：CSV 或 JSON 檔案的位置。

範例：

輸入下列指令，可將 myfile.csv 從您的本機載入至儲存於 mydataset 資料集內名稱為 mytable 的資料表。

bq load --autodetect --source_format=CSV mydataset.mytable ./myfile.csv

輸入下列指令，可將 myfile.json 從您的本機載入至儲存於 mydataset 資料集內名稱為 mytable 的資料表。

bq load --autodetect --source_format=NEWLINE_DELIMITED_JSON \
mydataset.mytable ./myfile.json