Cloud Composer 3 | Cloud Composer 2 | Cloud Composer 1
이 페이지에서는 Cloud Composer 환경을 업데이트하거나 업그레이드할 때 발생할 수 있는 문제에 대한 문제 해결 정보를 제공합니다.
환경 만들기와 관련된 문제 해결 정보는 환경 만들기 문제 해결을 참조하세요.
Cloud Composer 환경이 업데이트될 때 대부분의 문제는 다음과 같은 이유로 발생합니다.
- 서비스 계정 권한 문제
- PyPI 종속 항목 문제
- Airflow 데이터베이스 크기
환경 업데이트 또는 업그레이드 권한 부족
권한 부족으로 인해 Cloud Composer가 환경을 업데이트하거나 업그레이드할 수 없으면 다음 오류 메시지가 출력됩니다.
ERROR: (gcloud.composer.environments.update) PERMISSION_DENIED: The caller does not have permission
해결책: 액세스 제어에 설명된 대로 사용자 계정과 사용자 환경의 서비스 계정 모두에 역할을 할당합니다.
환경의 서비스 계정에 권한이 충분하지 않음
Cloud Composer 환경을 만들 때 환경의 대부분의 작업을 실행하는 서비스 계정을 지정합니다. 이 서비스 계정에 요청된 작업에 대한 권한이 충분하지 않은 경우 Cloud Composer에서 다음 오류를 출력합니다.
UPDATE operation on this environment failed 3 minutes ago with the
following error message:
Composer Backend timed out. Currently running tasks are [stage:
CP_COMPOSER_AGENT_RUNNING
description: "No agent response published."
response_timestamp {
seconds: 1618203503
nanos: 291000000
}
].
해결 방법: 액세스 제어에 설명된 대로 Google 계정과 사용자 환경의 서비스 계정에 역할을 할당합니다.
Airflow 데이터베이스 크기가 너무 커서 작업을 수행할 수 없음
Airflow 데이터베이스의 크기가 너무 커서 업그레이드 작업이 성공할 수 없기 때문에 업그레이드 작업이 성공하지 못할 수 있습니다.
Airflow 데이터베이스 크기가 16GB를 초과하면 Cloud Composer가 다음 오류를 출력합니다.
Airflow database uses more than 16 GB. Please clean the database before upgrading.
해결 방법: Airflow 데이터베이스 정리에 설명된 대로 Airflow 데이터베이스 정리를 수행합니다.
PyPI 패키지 충돌로 인해 새 Cloud Composer 버전으로 업그레이드할 수 없음
커스텀 PyPI 패키지가 설치된 환경을 업그레이드할 때 PyPI 패키지 충돌과 관련된 오류가 발생할 수 있습니다. 이는 새 Cloud Composer 이미지에 사전 설치된 패키지의 최신 버전이 포함되어 있기 때문입니다. 이로 인해 환경에 설치한 PyPI 패키지와 종속 항목이 충돌할 수 있습니다.
해결책:
- 패키지 충돌에 대한 자세한 정보를 확인하려면 업그레이드 확인을 실행합니다.
- 설치된 커스텀 PyPI 패키지의 버전 제약조건을 완화합니다. 예를 들어 버전을
==1.0.1
로 지정하는 대신>=1.0.1
로 지정합니다. - 충돌 종속 항목을 해결하기 위한 버전 변경 요구사항에 대한 자세한 내용은 pip 문서를 참조하세요.
계속 지원되는 버전으로 환경을 업그레이드할 수 없음
Cloud Composer 환경을 일부 최신 버전과 이전 버전으로만 업그레이드할 수 있습니다.
새 환경을 만들 때와 기존 환경을 업그레이드할 때의 버전 제한사항은 다릅니다. 새 환경을 만들 때 선택한 Cloud Composer 버전은 기존 환경을 업그레이드할 때 사용할 수 없을 수 있습니다.
Google Cloud CLI, API 또는 Terraform을 사용하여 업그레이드 작업을 수행할 수 있습니다. Google Cloud 콘솔에서는 최신 버전만으로 업그레이드할 수 있습니다.
환경이 정상이 아님 (활성 상태 확인 실패)
상태가 정상적으로 보고된 경우에만 환경을 업그레이드할 수 있습니다.
상태가 정상적이지 않은 가장 일반적인 원인 중 하나는 환경 구성요소가 구성된 리소스 한도에 도달하고 최대 부하로 지속적으로 작동하는 경우입니다. 일부 환경 구성요소는 상태를 보고할 수 없으므로 실시간 확인 DAG는 환경의 상태를 정상이 아닌 것으로 보고합니다.
이 문제를 해결하려면 리소스 한도를 늘리는 것이 좋습니다. 항상 환경이 한도에 도달하지 않도록 유지하는 것이 좋지만, 환경이 업그레이드되는 기간에만 한도를 유지할 수도 있습니다.
DNS 연결이 부족하면 업그레이드 또는 업데이트를 수행하는 동안 문제가 발생할 수 있음
이러한 연결 문제는 다음과 같은 로그 항목을 일으킬 수 있습니다.
WARNING - Compute Engine Metadata server unavailable attempt 1 of 5. Reason: [Errno -3] Temporary failure in name resolution Error
일반적으로 DNS에 대한 경로가 없기 때문에 metadata.google.internal DNS 이름을 클러스터, 포드, 서비스 네트워크 내의 IP 주소로 확인할 수 있는지 확인합니다. 환경이 생성된 VPC (호스트 또는 서비스 프로젝트) 내에서 비공개 Google 액세스가 사용 설정되어 있는지 확인합니다.
##