Hello 文字資料:建立文字分類資料集並匯入文件
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
使用 Vertex AI 控制台建立文字分類資料集。建立資料集後,請使用複製到 Cloud Storage 值區的 CSV 檔案,將這些文件匯入資料集。
本教學課程包含多個頁面:
設定專案和環境
建立文字分類資料集。
訓練 AutoML 文字分類模型。
將模型部署至端點並傳送預測結果。
清除專案所用資源。
每個頁面都假設您已執行教學課程先前頁面中的操作說明。
前往 Vertex AI 控制台。
在「開始使用 Vertex AI」頁面中,按一下「建立資料集」。
指定資料集詳細資料。
為這個資料集指定名稱,例如 text_classification_tutorial
。
在「選取資料類型和目標」部分,點選「文字」,然後選取「文字分類 (單一標籤)」。
在「Region」(區域) 中,選取「us-central1」。
本教學課程使用 us-central1
,但 Vertex AI 支援其他區域,例如 europe-west4
。
按一下「建立」,建立空白資料集,然後匯入文件。
在匯入頁面上,選取 radio_button_checked「選取 Cloud Storage 中的匯入檔案」,然後指定 CSV 檔案的 Cloud Storage 位置。提示:按一下「Browse」,在「Select object」對話方塊中選取 happiness.csv
檔案,然後按一下「Select」。
本教學課程所用的 CSV 檔案位於:gs://${BUCKET}/text/happiness.csv
。本教學課程的值區與資料集位於相同區域,但您可以指定任何區域的值區中的檔案。
保留「預設」資料分割。
Vertex AI 會自動將文件指派給訓練集、驗證集和測試集。詳情請參閱「AutoML 模型資料分割作業簡介」。
按一下「繼續」即可開始匯入。
匯入程序需要幾分鐘的時間。匯入完成後,您可以在資料集的「Browse」分頁中,瀏覽所有匯入的文件及其相關標籤。
後續步驟
請參閱本教學課程的下一頁,開始執行 AutoML 模型訓練工作。
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-06-23 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-06-23 (世界標準時間)。"],[],[]]