YouTube 콘텐츠 소유자 전송
YouTube 콘텐츠 소유자용 BigQuery Data Transfer Service를 사용하면 YouTube 콘텐츠 소유자 보고서와 관련한 반복되는 로드 작업을 자동으로 예약하고 관리할 수 있습니다.
지원되는 보고서
- 콘텐츠 소유자 보고서
- 시스템 관리형 보고서
YouTube 콘텐츠 소유자 보고서용 BigQuery Data Transfer Service는 다음과 같은 보고 옵션을 지원합니다.
보고 옵션 | 지원 |
---|---|
지원되는 API 버전 | 2018년 6월 18일 |
반복 빈도 | 매일 UTC 기준 오후 2시 45분경 시간은 구성 가능합니다. |
새로고침 범위 | 지난 1일 구성할 수 없음 |
최대 백필 기간 | 30일 2018년 7월부터 이전 데이터가 포함된 YouTube 보고서를 생성된 시점부터 30일 동안 사용할 수 있습니다. 이전 데이터 외의 데이터가 포함된 보고서는 정책 변경 후 60일 동안 사용할 수 있습니다. 자세한 내용은 YouTube Reporting AI 참고 리소스의 이전 데이터를 참조하세요. |
YouTube 콘텐츠 소유자 보고서가 BigQuery 테이블 및 뷰로 전송되는 방식에 대한 자세한 내용은 YouTube 콘텐츠 소유자 보고서 변환을 참조하세요.
YouTube 콘텐츠 소유자 전송에서 데이터 수집
YouTube 콘텐츠 소유자 보고서의 데이터를 BigQuery로 전송하면 데이터는 날짜를 기준으로 파티션을 나눈 BigQuery 테이블에 로드됩니다. 데이터가 로드되는 테이블 파티션은 데이터 소스의 날짜에 해당합니다. 동일한 날짜에 여러 전송을 예약하면 BigQuery Data Transfer Service가 해당 날짜의 파티션을 최신 데이터로 덮어씁니다. 동일한 일자에 전송이 여러 개 있거나 백필을 실행해도 데이터가 중복되지 않으며 다른 일자의 파티션에 영향을 주지 않습니다.새로고침 기간
새로고침 기간은 데이터 전송이 발생할 때 데이터 전송이 데이터를 검색하는 일 수입니다. 예를 들어 새로고침 기간이 3일이고 일일 전송이 발생하는 경우 BigQuery Data Transfer Service는 소스 테이블에서 지난 3일 동안의 모든 데이터를 검색합니다. 이 예시에서 일일 전송이 발생하면 BigQuery Data Transfer Service는 현재 날짜의 소스 테이블 데이터 사본이 포함된 새 BigQuery 대상 테이블 파티션을 만든 다음 백필 실행을 자동으로 트리거하여 BigQuery 대상 테이블 파티션을 지난 2일 동안의 소스 테이블 데이터로 업데이트합니다. 자동으로 트리거된 백필 실행은 BigQuery Data Transfer Service 커넥터에서 증분 업데이트가 지원되는지 여부에 따라 BigQuery 대상 테이블을 덮어쓰거나 증분 업데이트합니다.
데이터 전송을 처음 실행하면 데이터 전송이 새로고침 기간 내에 사용 가능한 모든 소스 데이터를 검색합니다. 예를 들어 새로고침 기간이 3일이고 데이터 전송을 처음 실행하는 경우 BigQuery Data Transfer Service는 3일 이내에 모든 소스 데이터를 검색합니다.
새로고침 기간은 TransferConfig.data_refresh_window_days
API 필드에 매핑됩니다.
새로고침 기간 외의 데이터(예: 이전 데이터)를 검색하거나 전송 중단 또는 불일치 문제를 해결하려면 백필 실행을 시작하거나 예약하면 됩니다.
제한사항
- 각 보고서에 지원되는 최대 파일 크기는 1,710GB입니다.
- 데이터 전송을 예약할 수 있는 최소 빈도는 24시간에 한 번입니다. 기본적으로 데이터 전송은 사용자가 데이터 전송을 만드는 시간에 시작됩니다. 하지만 전송을 설정할 때 전송 시작 시간을 구성할 수 있습니다.
- BigQuery Data Transfer Service는 YouTube 콘텐츠 소유자 전송 중 증분 데이터 전송을 지원하지 않습니다. 데이터 전송에 대해 날짜를 지정하면 해당 날짜에 사용 가능한 모든 데이터가 전송됩니다.
시작하기 전에
YouTube 콘텐츠 소유자 데이터 전송을 만들기 전에 다음을 수행하세요.
- BigQuery Data Transfer Service 사용 설정에 필요한 모든 작업을 완료했는지 확인합니다.
- YouTube 데이터를 저장할 BigQuery 데이터세트를 만듭니다.
- YouTube 콘텐츠 소유자 계정이 있는지 확인합니다. YouTube 콘텐츠 소유자는 YouTube 채널과 다릅니다. 관리하는 채널이 여러 개라면 YouTube 콘텐츠 소유자 계정만 보유하게 됩니다.
- Pub/Sub의 전송 실행 알림을 설정하려면
pubsub.topics.setIamPolicy
권한이 있어야 합니다. 이메일 알림만 설정한다면 Pub/Sub 권한이 필요하지 않습니다. 자세한 내용은 BigQuery Data Transfer Service 실행 알림을 참조하세요.
필수 권한
데이터 전송을 만드는 사용자에게 다음과 같은 필수 권한이 있어야 합니다.
BigQuery:
- 데이터 전송을 만드는
bigquery.transfers.update
권한 - 대상 데이터 세트에 대한
bigquery.datasets.get
및bigquery.datasets.update
권한
사전 정의된 IAM 역할
bigquery.admin
에는bigquery.transfers.update
,bigquery.datasets.update
,bigquery.datasets.get
권한이 있습니다. BigQuery Data Transfer Service의 IAM 역할에 대한 자세한 내용은 액세스 제어를 확인하세요.- 데이터 전송을 만드는
YouTube:
- YouTube 콘텐츠 관리자 또는 YouTube 콘텐츠 소유자
콘텐츠 관리자에게는 콘텐츠 소유자를 대신해 YouTube 콘텐츠를 관리할 수 있는 권한이 부여됩니다. 콘텐츠 소유자는 하나 이상의 YouTube 채널과 각 채널 내 동영상을 소유한 상위 계정입니다.
- YouTube 콘텐츠 소유자 보고서 설정에서
Hide revenue data
가 선택 해제되어 있습니다.
수익 관련 보고서를 전송하려면 전송을 만드는 사용자에 대하여 YouTube 보고서 권한 설정
Hide revenue data
를 선택 해제해야 합니다.
YouTube 콘텐츠 소유자 전송 설정
YouTube 콘텐츠 소유자 데이터 전송을 설정하려면 다음 요소가 필요합니다.
- 콘텐츠 소유자 ID: YouTube가 제공합니다. 콘텐츠 소유자나 관리자로 YouTube에 로그인하면 URL의
o=
뒤에 ID가 표시됩니다. 예를 들어 URL이https://studio.youtube.com/owner/AbCDE_8FghIjK?o=AbCDE_8FghIjK
이면 콘텐츠 소유자 ID는AbCDE_8FghIjK
입니다. 다른 콘텐츠 관리자 계정을 선택하려면 콘텐츠 관리자 계정에 로그인 또는 YouTube 채널 전환을 참조하세요. 콘텐츠 관리자 계정을 만들고 관리하는 방법에 대한 자세한 내용은 콘텐츠 관리자 계정 설정 구성을 참조하세요. - 테이블 서픽스: 전송을 설정할 때 제공되는 사용자 친화적인 채널 이름입니다. 테이블 이름을 만들 때 이 서픽스가 작업 ID에 추가됩니다(예: reportTypeId_suffix). 서픽스는 동일한 테이블에 개별 데이터 전송이 기록되는 경우를 방지하려는 목적으로 사용합니다. 테이블 서픽스는 같은 데이터세트에 데이터를 로드하는 모든 전송에서 고유해야 하며 결과 테이블 이름의 길이를 최소화하도록 짧은 서픽스를 사용해야 합니다.
YouTube Reporting API를 사용하며 기존 보고 작업이 있다면 BigQuery Data Transfer Service는 사용자의 보고 데이터를 로드합니다. 기존 보고 작업이 없는 경우 데이터 전송을 설정하면 YouTube 보고 작업이 자동으로 사용 설정됩니다.
YouTube 콘텐츠 소유자 데이터 전송을 설정하는 방법은 다음과 같습니다.
콘솔
Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다. 콘텐츠 소유자 또는 콘텐츠 관리자로 계정에 로그인했는지 확인합니다.
전송을 클릭합니다.
전송 만들기를 클릭합니다.
전송 만들기 페이지에서 다음을 수행합니다.
소스 유형 섹션에서 소스에 YouTube 콘텐츠 소유자를 선택합니다.
전송 구성 이름 섹션의 표시 이름에 데이터 전송 이름(예:
My Transfer
)을 입력합니다. 전송 이름은 나중에 수정해야 할 경우를 대비해 전송을 식별할 수 있는 값이면 됩니다.일정 옵션 섹션에서 다음을 수행합니다.
반복 빈도에 대해 데이터 전송을 실행하려는 빈도 옵션을 선택합니다. 일을 선택한 경우 UTC로 유효한 시간을 제공합니다.
- 시간
- 일
- 주문형
해당하는 경우 지금 시작 또는 설정 시간에 시작을 선택하고 시작 날짜와 실행 시간을 제공합니다.
대상 설정 섹션의 대상 데이터세트에서 데이터를 저장하기 위해 만든 데이터세트를 선택합니다.
데이터 소스 세부정보 섹션에서 다음을 수행합니다.
- 콘텐츠 소유자 ID에 콘텐츠 소유자 ID를 입력합니다.
테이블 서픽스에 서픽스(예:
MT
)를 입력합니다.
서비스 계정 메뉴에서 Google Cloud 프로젝트와 연결된 서비스 계정의 서비스 계정을 선택합니다. 사용자 인증 정보를 사용하는 대신 서비스 계정을 데이터 전송에 연결할 수 있습니다. 데이터 전송에서 서비스 계정을 사용하는 방법에 대한 자세한 내용은 서비스 계정 사용을 참조하세요.
(선택사항) 알림 옵션 섹션에서 다음을 수행합니다.
저장을 클릭합니다.
계정에 처음으로 로그인하는 경우 계정을 선택한 다음 허용을 클릭합니다. 콘텐츠 소유자 또는 콘텐츠 관리자인 계정을 선택합니다.
bq
bq mk
명령어를 입력하고 전송 생성 플래그 --transfer_config
를 지정합니다. 다음 플래그도 필요합니다.
--data_source
--target_dataset
--display_name
--params
선택적 플래그:
--service_account_name
- 사용자 계정 대신 콘텐츠 소유자 전송 인증에 사용할 서비스 계정을 지정합니다.
bq mk \ --transfer_config \ --project_id=project_id \ --target_dataset=dataset \ --display_name=name \ --params='parameters' \ --data_source=data_source \ --service_account_name=service_account_name
각 항목의 의미는 다음과 같습니다.
- project_id는 프로젝트 ID입니다.
- dataset는 전송 구성 대상 데이터 세트입니다.
- name은 전송 구성의 표시 이름입니다. 데이터 전송 이름은 나중에 수정해야 할 경우를 대비해 간편하게 전송을 식별할 수 있는 값이면 됩니다.
- parameters에는 JSON 형식으로 생성된 전송 구성의 매개변수가 있습니다. 예를 들면
--params='{"param":"param_value"}'
입니다. YouTube 콘텐츠 소유자 데이터 전송에는content_owner_id
와table_suffix
매개변수를 제공해야 합니다. 필요한 경우 BigQuery Data Transfer Service가 사용자를 대신해 YouTube 보고 작업을 관리할 수 있도록configure_jobs
매개변수를true
로 설정할 수도 있습니다. 계정에 존재하지 않는 YouTube 보고서가 있다면 해당 보고서를 사용할 수 있도록 새로운 보고 작업이 생성됩니다. - data_source는 데이터 소스(
youtube_content_owner
)입니다. - service_account_name은 데이터 전송을 인증하는 데 사용되는 서비스 계정 이름입니다. 서비스 계정은 전송을 만드는 데 사용한 것과 동일한
project_id
가 소유해야 하며 모든 필수 권한이 있어야 합니다.
또한 --project_id
플래그를 입력하여 특정 프로젝트를 지정할 수도 있습니다. --project_id
를 지정하지 않으면 기본 프로젝트가 사용됩니다.
예를 들어 다음 명령어는 콘텐츠 소유자 ID AbCDE_8FghIjK
, 테이블 서픽스 MT
, 대상 데이터 세트 mydataset
를 사용하여 My Transfer
라는 YouTube 콘텐츠 소유자 데이터 전송을 만듭니다. 기본 프로젝트에 데이터 전송이 생성됩니다.
bq mk \
--transfer_config \
--target_dataset=mydataset \
--display_name='My Transfer' \
--params='{"content_owner_id":"abCDE_8FghIjK","table_suffix":"MT","configure_jobs":"true"}' \
--data_source=youtube_content_owner
API
projects.locations.transferConfigs.create
메서드를 사용하고 TransferConfig
리소스의 인스턴스를 지정합니다.
자바
이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.
BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.
데이터 쿼리
BigQuery로 전송되는 데이터는 내부 데이터화 시간별로 파티션을 나눈 테이블에 기록됩니다. 자세한 내용은 파티션을 나눈 테이블을 참조하세요.
자동 생성된 뷰를 사용하지 않고 직접 테이블을 쿼리하는 경우에는 쿼리에서 _PARTITIONTIME
유사 열을 사용해야 합니다. 자세한 내용은 파티션을 나눈 테이블 쿼리를 참조하세요.
YouTube 콘텐츠 소유자 전송 설정 문제 해결
전송을 설정하는 데 문제가 있다면 전송 구성 문제 해결의 YouTube 전송 문제를 참조하세요.