이 문서는 Dataform의 워크스페이스 개념과 기능을 이해하는 데 도움이 됩니다.
Dataform에서는 개발 작업공간에서 SQL 워크플로 코드와 상호작용합니다. 개발 작업공간은 자체적으로 수정 가능한 저장소 사본입니다. 작업공간에서는 동일한 저장소에서 작업하는 다른 사용자에게 영향을 주지 않고 저장소의 콘텐츠를 생성, 수정 또는 삭제한 후 변경사항을 커밋하고 저장소로 내보낼 수 있습니다.
Dataform 코어 또는 JavaScript를 사용하여 SQL 워크플로를 개발할 수 있습니다. Dataform은 코드를 실시간으로 SQL 쿼리로 컴파일합니다.
개발 작업공간에서는 다음 작업을 수행할 수 있습니다.
- Dataform 설정 구성하기
- 지원되는 모든 유형의 테이블 만들기
- 문서 표
- 테이블 파티션 나누기
- 테이블에 BigQuery 라벨 및 정책 태그 추가
- 추가 테이블 설정 구성
- SQL 워크플로의 데이터 소스 선언
- SQL 워크플로에 커스텀 SQL 작업 및 태그 추가
- SQL 워크플로 또는 선택한 작업의 실행 트리거
- 실행 로그 검사
개발 워크스페이스의 구성요소
Dataform 개발 작업공간은 다음 탭으로 구성됩니다.
- 코드
- 파일을 살펴보고, 쿼리를 개발하고, 변경사항을 버전 제어하고, BigQuery에 대한 실행을 트리거할 수 있는 개발 환경을 포함합니다.
- 컴파일된 그래프
- 작업공간에서 정의된 컴파일된 SQL 워크플로를 대화형 방향성 비순환 그래프(DAG)로 표시합니다. SQL 워크플로에 컴파일 오류가 있으면 탭에 그래프 대신 오류 메시지가 표시됩니다.
- 실행
- 작업공간에서 트리거된 모든 실행의 로그를 표시합니다. 선택한 실행의 작업과 세부정보를 볼 수도 있습니다. 자세한 내용은 작업공간 실행 로그 검사를 참고하세요.
코드 탭의 구성요소
개발 작업공간의 코드 탭에는 SQL 워크플로를 개발할 수 있도록 해주는 다음 구성요소가 포함되어 있습니다.
- 파일 창
- 작업공간의 파일 구조를 표시합니다. 수정사항을 파일 구조에 자동 저장합니다. 선택한 파일은 개발 창의 탭에서 열립니다. 검색할 내용 입력 입력란에서 경로를 기준으로 워크스페이스의 파일 또는 디렉터리를 검색할 수 있습니다.
- 버전 제어 창
- 작업공간의 버전 제어 상태와 버전 제어 옵션을 표시합니다.
- 개발 창
- 탭에 파일 열기가 표시됩니다. 수정된 파일의 변경사항을 자동으로 저장합니다.
- 실행 버튼
- 컴파일된 SQL 쿼리의 미리보기를 실행합니다.
- 서식 버튼
- Dataform 코어 또는 JavaScript 코드의 형식을 지정합니다.
- 컴파일 상태
- 작업공간의 코드 컴파일 상태를 표시합니다.
- 메타데이터 창
- 현재 수정 중인 파일의 메타데이터를 표시합니다.
- 컴파일된 쿼리 창
- 현재 수정 중인 파일의 쿼리를 SQL로 컴파일합니다. 쿼리 컴파일이 실패하면 컴파일 오류가 표시됩니다. 쿼리 컴파일이 성공하면 컴파일된 쿼리를 표시하고 BigQuery에 대한 테스트 실행을 통해 검증합니다. 쿼리 유효성 검사에 실패하면 유효성 검사 오류를 표시합니다. 쿼리 유효성 검사에 성공하면 BigQuery에 대한 쿼리 실행에 사용할 바이트 수를 표시합니다.
- 실행 시작 드롭다운
- 작업공간 또는 선택한 요소에서 전체 워크플로 실행의 트리거 옵션을 표시합니다.
컴파일된 그래프 탭의 구성요소
컴파일된 그래프 탭에는 컴파일된 SQL 워크플로의 대화형 그래프가 표시됩니다. 그래프에는 SQL 워크플로의 모든 작업과 작업 간의 관계가 표시됩니다.
확대/축소하고 드래그하여 그래프를 탐색할 수 있습니다.
다음 속성으로 그래프를 필터링할 수 있습니다.
- 이름
- 태그
- 유형
- 어설션
- 선언
- 증분 테이블
- 구체화된 뷰
- 운영
- 테이블
- 알 수 없음
- 뷰
한 번에 여러 필터를 선택할 수 있습니다.
Dataform은 이를 OR
조건과 함께 적용합니다.
그래프에서 작업을 클릭하면 다음 창에서 세부정보를 확인할 수 있습니다.
- 메타데이터 창
- 선택 작업의 전체 이름, 유형, 종속성, 종속 항목을 표시합니다.
- 쿼리 창
- 선택한 작업의 컴파일된 SQL 쿼리를 표시합니다.
워크스페이스의 버전 관리
작업공간에서는 Git 기반 버전 제어를 통해 저장소와 상호작용합니다. 작업공간에서 파일에 대한 수정은 커밋할 수 있는 로컬 변경사항(커밋되지 않은 상태)으로 시작된 다음 모든 저장소 사용자가 사용할 수 있도록 저장소로 푸시합니다.
저장소가 원격 Git 제공업체에 연결되면 작업공간에서 기본 개발 브랜치로 변경사항을 푸시합니다. 저장소를 원격 Git 제공업체에 연결할 때 기본 브랜치를 선택합니다. 연결되지 않은 Dataform 저장소에서 변경사항을 기본 브랜치로 푸시합니다.
Dataform 저장소 또는 원격 저장소에서 변경사항을 가져와 개발 작업공간의 로컬 변경사항과 병합할 수도 있습니다. Dataform의 버전 제어에 관한 자세한 내용은 코드 버전 관리를 참고하세요.
다음 단계
- 작업공간을 만들고 초기화하는 방법은 작업공간 만들기 참조하기
- Dataform 코드 버전을 제어하는 방법은 코드 버전 제어 참조하기
- 미리보기를 실행하여 SQL 쿼리를 테스트하는 방법을 알아보려면 SQL 쿼리 미리보기 참조하기