Vertex AI 및 Python SDK를 사용하여 모델 학습

이 튜토리얼은 Python용 Vertex AI SDK를 사용하여 커스텀 학습 모델을 만드는 방법을 처음부터 끝까지 보여주는 가이드입니다. Docker 컨테이너를 사용하여 모델을 학습시키고 만드는 노트북 (IPYNB) 파일에서 코드를 실행합니다. 이 튜토리얼은 Vertex AI를 처음 접하며 노트북, Python, 머신러닝(ML) 워크플로에 익숙한 데이터 과학자를 대상으로 합니다.

이 프로세스에서는 먼저 Google Cloud 콘솔을 사용하여 작업이 포함된 프로젝트를 만듭니다. 프로젝트에서 Vertex AI Workbench를 사용하여 Jupyter 노트북을 만듭니다. 노트북 환경은 데이터 세트를 다운로드하고 준비하는 코드를 실행한 후 데이터 세트를 사용하여 모델을 만들고 학습시키는 장소입니다. 튜토리얼이 끝나면 학습된 모델에서 예측을 생성합니다.

이 튜토리얼의 목표는 1시간 이내에 예측을 만드는 데 필요한 모든 단계를 설명하는 것입니다. 사용되는 데이터 세트가 비교적 작으므로 모델을 학습시키는 데 시간이 오래 걸리지 않습니다. 튜토리얼을 완료한 후 학습한 내용을 더 큰 데이터 세트에 적용하면 됩니다. 데이터 세트가 클수록 예측이 더 정확해집니다.

튜토리얼 단계

  1. 기본 요건 - Google Cloud 계정과 프로젝트를 만듭니다.

  2. 노트북 만들기 - Jupyter 노트북과 해당 환경을 만들고 준비합니다. 노트북을 사용하여 데이터 세트를 만들고 모델을 만들고 학습시키며 예측을 생성하는 코드를 실행합니다.

  3. 데이터 세트 만들기 - 공개적으로 사용 가능한 BigQuery 데이터 세트를 다운로드한 후 이를 사용하여 Vertex AI 테이블 형식 데이터 세트를 만듭니다. 데이터 세트에는 모델을 학습시키는 데 사용하는 데이터가 포함되어 있습니다.

  4. 학습 스크립트 만들기 - 학습 작업에 전달할 Python 스크립트를 만듭니다 학습 작업이 모델을 학습시키고 만들 때 이 스크립트가 실행됩니다.

  5. 모델 학습 - 테이블 형식 데이터 세트를 사용하여 모델을 학습시키고 배포합니다. 모델을 사용하여 예측을 만듭니다.

  6. 예측 수행 - 모델을 사용하여 예측을 만듭니다. 이 섹션에서는 불필요한 요금이 발생하지 않도록 이 튜토리얼을 실행하는 동안 만든 리소스를 삭제하는 방법도 안내합니다.

학습 내용

이 튜토리얼에서는 Python용 Vertex AI SDK를 사용하여 다음을 수행하는 방법을 안내합니다.

  • 데이터 세트를 저장할 Cloud Storage 버킷 만들기
  • 학습을 위해 데이터 사전 처리
  • 처리된 데이터를 사용하여 BigQuery에 데이터 세트 만들기
  • BigQuery 데이터 세트를 사용하여 Vertex AI 테이블 형식 데이터 세트 만들기
  • 커스텀 학습 모델을 만들고 학습시키기
  • 엔드포인트에 커스텀 학습 모델 배포
  • 예측 생성
  • 모델 배포 취소
  • 추가 요금이 발생하지 않도록 튜토리얼에서 만든 모든 리소스 삭제하기

사용되는 청구 가능한 리소스

이 튜토리얼에서는 Vertex AI, BigQuery 및 Cloud Storage Google Cloud 서비스와 연결된 청구 가능한 리소스를 사용합니다. Google Cloud를 처음 사용하는 경우 이러한 서비스 중 하나 이상을 무료로 사용할 수 있습니다. Vertex AI는 신규 고객에게 무료 크레딧 $300를 제공하며 Cloud Storage 및 BigQuery에는 무료 등급이 있습니다. 자세한 내용은 다음을 참조하세요.

추가 요금이 부과되지 않도록 튜토리얼의 마지막 단계에서 자신이 만든 청구 가능한 모든 Google Cloud 리소스를 삭제하는 방법을 안내합니다.