Hello 테이블 형식 데이터: 데이터 세트 만들기 및 AutoML 분류 모델 학습

Google Cloud Console을 사용하여 테이블 형식 데이터 세트를 만들고 분류 모델을 학습시킵니다.

테이블 형식 데이터 세트 만들기

  1. Google Cloud 콘솔의 Vertex AI 섹션에서 데이터 세트 페이지로 이동합니다.

    데이터 세트 페이지로 이동

  2. 버튼 모음에서 만들기를 클릭하여 새 데이터 세트를 만듭니다.

  3. 데이터 세트 이름에 Structured_AutoML_Tutorial을 입력하고 테이블 형식 탭을 선택합니다.

  4. 회귀/분류 목표를 선택합니다.

    리전us-central1로 둡니다.

  5. 만들기를 클릭하여 데이터 세트를 만듭니다.

    이 튜토리얼에서는 Cloud Storage에서 호스팅되는 공개적으로 사용 가능한 빈 데이터 세트를 사용합니다.

  6. 데이터 소스 선택에서 Cloud Storage에서 CSV 파일 선택을 클릭합니다.

  7. 파일 경로 가져오기cloud-ml-tables-data/bank-marketing.csv를 입력합니다.

  8. 계속을 클릭합니다.

데이터 세트 분석

분석 섹션에서는 누락된 값 또는 널 값과 같은 데이터 세트의 추가 정보를 볼 수 있습니다.

이 튜토리얼에서는 데이터 세트 형식이 올바르게 지정되었기 때문에 이 페이지에서 어떤 작업도 수행할 필요가 없고 이 섹션을 건너뛰면 됩니다.

  1. 선택사항. 데이터 세트의 결측값 또는 null 값 수를 보려면 통계 생성을 클릭합니다. 이 작업은 10분 이상 걸릴 수 있습니다.

  2. 선택사항. 데이터 값에 대해 자세히 알아보려면 특성 열 중 하나를 클릭합니다.

AutoML 분류 모델 학습

  1. 새 모델 학습을 클릭합니다.

  2. 기타를 선택합니다.

  3. 학습 방법 창에서 이전에 만든 데이터 세트가 데이터 세트 필드에 선택되어 있는지 확인합니다.

  4. 목표 필드에서 분류를 선택합니다.

  5. AutoML 학습 방법이 선택되었는지 확인합니다.

  6. 계속을 클릭합니다.

  7. 모델 세부정보 창에서 타겟 열에 Deposit을 선택하고 계속을 클릭합니다.

    타겟 열은 예측 모델을 학습시킬 대상입니다. bank-marketing.csv 데이터 세트의 경우 Deposit 열은 클라이언트가 정기 예금에 가입했는지 여부를 나타냅니다(2 = 예, 1 = 아니요).

    학습 옵션 창에서는 특성을 추가하고 열 데이터를 변환할 수 있습니다. 열을 선택하지 않으면 기본적으로 대상이 아닌 모든 열이 학습 특성으로 사용됩니다. 이 데이터 세트는 즉시 사용할 수 있으므로 변환을 적용할 필요가 없습니다.

  8. 계속을 클릭합니다.

  9. 컴퓨팅 및 가격 책정 창에서 학습 예산에 1을 입력합니다.

    학습 예산에 따라 실제 학습 시간이 결정되지만 학습을 완료하는 데 걸리는 시간에는 다른 활동이 포함되므로 전체 프로세스가 1시간 이상 걸릴 수 있습니다. 모델 학습이 끝나면 녹색 체크 표시 상태 아이콘과 함께 모델 탭에 모델의 활성 링크가 표시됩니다.

  10. 학습 시작을 클릭합니다.

다음 단계

이제 모델 학습이 진행됩니다. 작업이 완료되려면 1시간 이상 걸릴 수 있습니다. 학습이 완료되면 이메일이 전송됩니다. 모델 학습이 끝나면 이 튜토리얼의 다음 페이지에 따라 모델을 배포하고 예측을 요청합니다.

이 튜토리얼에서는 AutoML 학습을 위해 정리되고 형식이 지정된 데이터 세트가 사용되지만 대부분의 데이터는 사용하기 전 일부 작업이 필요합니다. 학습 데이터의 품질은 생성하는 모델의 효율성에 영향을 줍니다. 데이터 준비에 대해 자세히 알아보세요.

데이터 소싱 및 준비는 정확한 머신러닝 모델을 보장하는 데 중요합니다. 권장사항에 대해 자세히 알아보세요.

테이블 형식 데이터 세트를 만드는 방법을 자세히 알아보세요.

Vertex AI는 두 가지 모델 학습 방법인 AutoML과 커스텀 학습을 제공합니다. AutoML을 사용하면 최소한의 노력 및 머신러닝 환경으로 학습을 수행할 수 있고 커스텀 학습을 사용하면 학습 특성을 완전히 제어할 수 있습니다. 학습 방법을 자세히 알아보세요.

Vertex AI는 소스 데이터 유형 및 특성 값을 검사하고 모델 학습에서 해당 특성을 사용할 방법을 추론합니다. 각 열의 데이터 유형을 검토해서 올바르게 해석되었는지 확인하는 것이 좋습니다. 필요한 경우 모든 특성에 대해 지원되는 서로 다른 변환을 지정할 수 있습니다. 변환에 대해 자세히 알아보세요.

AutoML의 분류 또는 회귀 학습에 대해 자세히 알아보세요.