Gemini로 데이터 준비하기
이 문서에서는 BigQuery에서 데이터 준비를 위한 SQL 코드 추천을 생성하고 관리하는 방법을 설명합니다.
자세한 내용은 BigQuery 데이터 준비 소개를 참고하세요.
시작하기 전에
BigQuery에서 데이터 준비 편집기 열기
새 데이터 준비를 만들거나 기존 테이블에서 데이터 준비를 만들거나 기존 데이터 준비를 열어 BigQuery에서 데이터 준비 편집기를 열 수 있습니다. 데이터 준비를 만들 때 어떤 일이 일어나는지에 관한 자세한 내용은 데이터 준비 진입점을 참고하세요.
BigQuery Studio 페이지에서 다음과 같은 방법으로 데이터 준비 편집기로 이동할 수 있습니다.
새로 만들기
BigQuery에서 새 데이터 준비를 만들려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
BigQuery로 이동 - 새로 만들기 목록으로 이동하여 데이터 준비를 클릭합니다. 데이터 준비 편집기가 제목이 없는 새 데이터 준비 탭에 표시됩니다.
- 편집기의 검색창에 테이블 이름 또는 키워드를 입력하고 테이블을 선택합니다. 테이블의 데이터 준비 편집기가 열리고 데이터 탭에 데이터 미리보기와 Gemini의 초기 데이터 준비 제안이 표시됩니다.
나중에 이 준비에 액세스할 수 있는 데이터 준비 리소스가 탐색기 창에 표시됩니다. - 선택사항: 보기를 간소화하려면 전체 화면 전체 화면을 클릭하여 전체 화면 모드를 사용 설정합니다.
테이블에서 새로 만들기
기존 테이블에서 새 데이터 준비를 만들려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
BigQuery로 이동 - 탐색기 창에서 테이블 위로 포인터를 가져갑니다.
- more_vert
메뉴 > 쿼리 > 데이터 준비를 클릭합니다. 테이블의 데이터 준비 편집기가 열리고 데이터 탭에 데이터 미리보기와 Gemini의 초기 데이터 준비 제안이 표시됩니다.
나중에 이 준비에 액세스할 수 있는 데이터 준비 리소스가 탐색기 창에 표시됩니다. - 선택사항: 보기를 간소화하려면 전체 화면 전체 화면을 클릭하여 전체 화면 모드를 사용 설정합니다.
기존 문서 열기
기존 데이터 준비의 편집기를 열려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
BigQuery로 이동 - 탐색기 창에서 프로젝트 이름과 데이터 준비를 클릭합니다.
- 기존 데이터 준비를 선택합니다. 데이터 준비 파이프라인의 그래프 보기가 표시됩니다.
- 그래프에서 노드 중 하나를 선택합니다. 테이블의 데이터 준비 편집기가 열리고 데이터 탭에 데이터 미리보기와 Gemini의 초기 데이터 준비 제안이 표시됩니다.
- 선택사항: 보기를 간소화하려면 전체 화면 전체 화면을 클릭하여 전체 화면 모드를 사용 설정합니다.
데이터 준비 단계 만들기
단계적으로 데이터를 준비합니다. Gemini에서 제안하는 단계를 미리 보거나 적용할 수 있습니다. 추천을 미세 조정하거나 자체 단계를 적용할 수도 있습니다. 지원되는 데이터 준비 단계에 관한 자세한 내용은 지원되는 단계를 참고하세요.
Gemini의 추천 보기 및 적용하기
이전 단계에서 테이블의 데이터 준비 편집기를 열면 Gemini가 로드한 테이블의 데이터와 스키마를 검사하고 추천을 생성합니다.
데이터 보기에서 데이터를 볼 때 열 이름 또는 특정 셀을 클릭합니다. Gemini는 해당 열 또는 셀과 관련된 필터 및 변환 제안을 생성합니다.
Gemini의 추천을 데이터 준비 단계로 적용합니다.
- 데이터 뷰에서 단계 목록으로 이동하여 추천을 검토합니다.
- 선택사항: 추천 카드에서 설명 또는 SQL 표현식을 수정하려면 미리보기를 클릭합니다.
- 적용을 클릭합니다.
- 선택사항: Gemini에서 더 나은 추천을 받으려면 예시를 제공하고 이 단계를 반복합니다.
단계 목록 탐색
데이터 보기에서 적용된 단계를 클릭하고 단계 목록을 검사하면 다음 작업을 수행할 수 있습니다.
- 단계를 수정하거나 삭제하려면 more_vert 메뉴를 클릭하고 변경합니다.
- 목록에서 단계를 선택하여 특정 단계의 데이터 샘플과 스키마를 확인합니다.
- 목록에서 단계를 선택하여 선택한 단계 뒤에 새 단계를 삽입합니다.
예시를 통해 추천 기능 개선하기
Gemini의 추천을 미세 조정하려면 셀에서 데이터가 어떻게 표시되어야 하는지 예시를 제공합니다.
데이터 보기에서 1~3개의 셀 값을 수정하여 해당 열의 값이 어떻게 표시되는지 보여줍니다. 예를 들어 모든 날짜의 형식을 지정하려는 방식으로 날짜를 입력합니다. Gemini는 변경사항에 따라 새로운 추천을 생성합니다.
제안 카드를 수정하려면 미리보기를 클릭합니다.
적용을 클릭합니다.
단계 직접 추가
요구사항을 충족하는 추천이 없으면 단계 추가를 클릭하고 단계 유형을 선택한 후 설명과 SQL 표현식을 입력하여 직접 추가합니다.
변환 추가
- 데이터 보기에서 열을 선택하고 단계 추가 > 변환을 클릭합니다.
- 단계에 대한 설명을 입력합니다.
- SQL 표현식을 입력합니다.
- 타겟 열 필드에서 열을 선택하거나 새 열을 만듭니다.
- 선택사항: 미리보기를 클릭하고 단계를 검토합니다.
- 적용을 클릭합니다.
행 필터링
행을 삭제하는 필터를 추가하려면 다음 단계를 따르세요.
- 데이터 보기에서 단계 추가 > 필터를 클릭합니다.
- 단계에 대한 설명을 입력합니다.
- SQL 표현식을 입력합니다.
- 선택사항: 미리보기를 클릭하고 단계를 검토합니다.
- 적용을 클릭합니다.
필터 표현식 형식
필터의 SQL 표현식은 지정된 조건과 일치하는 행을 유지합니다. 이는 SELECT … WHERE SQL_EXPRESSION
문과 동일합니다.
예를 들어 year
열이 2000
보다 크거나 같은 레코드를 유지하려면 조건이 year >= 2000
입니다.
표현식은 WHERE
절의 BigQuery SQL 구문을 따라야 합니다.
오류 테이블 구성 및 유효성 검사 규칙 추가
오류를 오류 테이블로 전송하거나 데이터 준비 실행을 실패시키는 검증 규칙을 만드는 필터를 추가할 수 있습니다.
오류 테이블 구성
오류 테이블을 구성하려면 다음 단계를 따르세요.
- 데이터 보기에서 툴바로 이동하여 더보기 > 오류 표를 클릭합니다.
- 오류 테이블 사용 설정을 클릭합니다.
- 테이블 위치를 정의합니다.
- 선택사항: 오류를 보관할 최대 기간을 정의합니다.
- 저장을 클릭합니다.
유효성 검사 규칙 추가
유효성 검사 규칙을 추가하려면 다음 단계를 따르세요.
- 데이터 보기에서 단계 추가 > 필터를 클릭합니다.
- 단계에 대한 설명을 입력합니다.
WHERE
절 형식의 SQL 표현식을 입력합니다.- 선택사항: SQL 표현식이 유효성 검사 규칙으로 작동하도록 하려면 검사 실패 행이 오류 테이블로 이동 체크박스를 선택합니다. 데이터 준비 툴바에서 더보기 > 오류 표를 클릭하여 필터를 유효성 검사로 변경할 수도 있습니다.
- 선택사항: 미리보기를 클릭하고 단계를 검토합니다.
- 적용을 클릭합니다.
열 삭제
데이터 준비에서 열을 삭제하려면 다음 단계를 따르세요.
- 스키마 보기에서 삭제할 열 옆에 있는 more_vert 메뉴를 클릭합니다.
- 삭제를 클릭합니다. 삭제된 열에 적용된 새 단계가 추가됩니다.
조인 연산 추가
데이터 준비에서 두 소스 간에 조인 작업 단계를 추가하려면 다음 단계를 따르세요.
- 데이터 준비의 노드에 대한 데이터 보기에서 단계 목록으로 이동하여 단계 추가 > 조인을 클릭합니다.
- 조인 구성 대화상자에서 조인 연산에 참여하는 다른 테이블 (조인의 오른쪽이라고 함)을 선택합니다.
- 선택사항: 각 테이블의 조인 키를 선택합니다. 조인 키는 데이터 유형이 같아야 합니다.
- 선택사항: 실행할 조인 작업 유형(예: 내부 조인)을 선택합니다.
선택사항: 조인 키를 지정하기 전에 오른쪽 테이블을 준비하려면(예: 조인에 있는 두 열의 데이터 유형이 다른 경우) 다음 단계를 따르세요.
- 조인 키를 선택하지 않고 조인을 저장합니다.
- 그래프 보기로 이동하여 오른쪽 소스 표를 선택합니다.
- 열의 데이터 유형 변환과 같은 오른쪽 테이블을 준비합니다.
- 키를 설정하여 이전 단계에서 저장한 조인을 수정합니다.
만들기를 클릭합니다.
테이블 중 하나에 해당하는 값이 없더라도 모든 테이블 행은 유지됩니다.
단계를 저장하면 선택한 소스 테이블 (조인의 오른쪽)과 조인 작업이 적용된 단계 목록과 데이터 준비의 그래프 뷰에 있는 노드에 반영됩니다.
대상 테이블 추가 또는 변경
데이터 준비 출력의 대상 테이블을 추가하거나 변경하려면 다음 단계를 따르세요.
- 데이터 보기에서 추가 > 대상을 클릭합니다.
- 대상 테이블이 저장된 프로젝트를 선택합니다.
- 데이터 세트 중 하나를 선택하거나 새 데이터 세트를 로드합니다.
- 대상 테이블을 입력합니다. 테이블이 없으면 데이터 준비가 첫 실행 시 새 테이블을 만듭니다. 자세한 내용은 쓰기 모드를 참고하세요.
- 데이터 세트를 대상 데이터 세트로 선택합니다.
- 저장을 클릭합니다.
데이터 준비 실행
데이터 준비 단계를 실행하고 준비된 데이터를 대상 테이블에 로드하려면 일회성 또는 반복적인 데이터 준비 실행을 예약합니다.
- 데이터 준비에서 대기 중인 변경사항을 저장합니다.
- 데이터 준비 툴바에서 일정을 클릭합니다.
- 일정 이름을 입력합니다.
- 실행과 연결된 서비스 계정 이름을 입력합니다.
- 빈도를 설정합니다.
- 일정 만들기를 클릭합니다.
자세한 내용은 데이터 준비 예약을 참고하세요.
데이터 준비 샘플 새로고침
샘플의 데이터는 자동으로 새로고침되지 않습니다. 데이터 준비의 소스 테이블에 있는 데이터가 변경되었지만 변경사항이 준비의 데이터 샘플에 반영되지 않은 경우 더보기 > 샘플 새로고침을 클릭합니다.
다음 단계
- 데이터 준비 관리에 대해 알아보세요.
- BigQuery의 Gemini 할당량 및 한도를 알아보세요.
- Gemini in BigQuery 가격 책정을 검토합니다.