생성형 AI 및 데이터 거버넌스

Google은 업계 최초로 AI/ML 개인 정보 보호 약정을 발표했습니다. 여기에는 클라우드에 저장된 고객 데이터에 대해 고객이 가장 높은 수준의 보안 및 제어 권한을 가져야 한다는 Google의 신념이 표명되어 있습니다. 이 약정은 Google Cloud의 생성형 AI 제품으로 확장됩니다. Google은 강력한 데이터 거버넌스 관행을 통해 팀이 이러한 약정을 준수하도록 하고 있으며, 여기에는 Google Cloud 가 제품 개발에 사용하는 데이터에 대한 검토도 포함됩니다. Google이 데이터를 처리하는 방식에 대한 자세한 내용은 Google Cloud 데이터 처리 추가 조항(CDPA)에서도 찾아볼 수 있습니다.

학습 제한

서비스별 약관의 서비스 약관 섹션의 17항 '학습 제한'에 설명된 대로 Google은 사용자의 사전 허가나 지시 없이 사용자 데이터를 사용하여 AI/ML 모델을 학습하거나 미세 조정하지 않습니다. 이는 GA 및 GA 이전 모델을 포함하여 Vertex AI의 모든 관리형 모델에 적용됩니다.

고객 데이터 보관 및 데이터 보관 제로 달성

고객 데이터는 다음 시나리오 및 조건에서 Google 모델의 Vertex AI에 제한된 기간 동안 보관됩니다. 데이터 보관 제로를 달성하려면 고객이 다음 각 영역에서 특정 조치를 취해야 합니다.

Google 모델의 데이터 캐싱: 기본적으로 Google 파운데이션 모델은 Gemini 모델의 입력을 캐시합니다. 이는 지연 시간을 줄이고 고객의 후속 프롬프트에 대한 응답을 가속화하기 위한 조치입니다. 캐시된 콘텐츠는 요청이 처리된 데이터 센터에 최대 24시간 동안 저장됩니다. 데이터 캐싱은 Google Cloud 프로젝트 수준에서 사용 설정 또는 사용 중지되며 캐시된 데이터에는 프로젝트 수준의 개인 정보 보호가 적용됩니다. Google Cloud 프로젝트의 동일한 캐시 설정이 모든 리전에 적용됩니다. 데이터 보관 제로를 달성하려면 데이터 캐싱을 사용 중지해야 합니다. 데이터 캐싱 사용 설정 및 사용 중지를 참조하세요.
Google 모델의 악용 모니터링을 위한 프롬프트 로깅: Google Cloud Platform 서비스 약관 4.3항 '생성형 AI 안전 및 악용'에 설명된 대로 Google은 고객에게 생성형 AI 서비스를 제공하는 과정에서 서비스이용 정책 및 금지된 사용 정책의 잠재적 악용 및 위반을 감지하기 위해 프롬프트를 로깅할 수 있습니다. Google Cloud 사용 시 Google Cloud Platform 서비스 약관이 적용되고 인보이스 발행 Cloud Billing 계정이 없는 고객만 악용 모니터링을 위한 프롬프트 로깅 대상입니다. 악용 모니터링을 위한 프롬프트 로깅 범위에 해당하며 데이터 보관 제로를 원하지 않는 경우 악용 모니터링에 대한 예외를 요청할 수 있습니다. 악용 모니터링을 참조하세요.
Google 검색을 사용한 그라운딩: 서비스별 약관 19항 '생성형 AI 서비스: Google 검색을 사용한 그라운딩'에 설명된 대로 Google은 고객이 제공할 수 있는 프롬프트 및 컨텍스트 정보를 저장하고, 그라운딩된 결과 및 추천 검색어를 생성하기 위해 30일 동안 생성된 출력을 저장합니다. 이렇게 저장된 정보는 Google 검색을 사용한 그라운딩을 지원하는 시스템의 디버깅 및 테스트에 사용될 수 있습니다. Google 검색을 사용한 그라운딩을 사용하는 경우 이 정보의 저장을 사용 중지할 방법이 없습니다.
Gemini Live API의 세션 재개: 이 기능은 기본적으로 사용 중지되어 있습니다. 사용자는 API 요청에서 필드를 지정하여 API를 호출할 때마다 이 기능을 사용 설정해야 하며, 캐시된 데이터에는 프로젝트 수준의 개인 정보 보호가 적용됩니다. 세션 재개를 사용 설정하면 사용자가 텍스트, 동영상, 음성 프롬프트 데이터, 모델 출력 등 캐시된 데이터를 최대 24시간 동안 저장하여 24시간 이내에 이전 세션에 다시 연결할 수 있습니다. 데이터 보관 제로를 달성하려면 이 기능을 사용 설정하지 마세요. 이 기능에 관한 자세한 내용(사용 설정 방법 포함)은 Live API를 참조하세요.

이는 GA 및 GA 이전 모델을 포함하여 Vertex AI의 모든 관리형 모델에 적용됩니다.

데이터 캐싱 사용 설정 및 사용 중지

다음 curl 명령어를 사용하여 캐싱 상태를 확인하거나 캐싱을 중지하거나 캐싱을 다시 사용 설정할 수 있습니다. 캐싱을 중지하거나 다시 사용 설정하면 변경사항이 모든 Google Cloud 리전에 적용됩니다. Identity and Access Management를 사용하여 캐싱을 사용 설정하거나 중지하는 데 필요한 권한을 부여하는 방법에 대한 자세한 내용은 IAM을 사용한 Vertex AI 액세스 제어를 참조하세요. 다음 섹션을 확장하여 현재 캐시 설정을 가져오고, 캐싱을 사용 중지 및 사용 설정하는 방법을 알아보세요.

현재 캐싱 설정 확인

다음 명령어를 실행하여 프로젝트에서 캐싱이 사용 설정 또는 중지되었는지 확인합니다. 이 명령어를 실행하려면 사용자에게 roles/aiplatform.viewer, roles/aiplatform.user, roles/aiplatform.admin 역할 중 하나가 부여되어 있어야 합니다.

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# GetCacheConfig
$ curl -X GET -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig

# Response if caching is enabled (caching is enabled by default).
{
  "name": "projects/PROJECT_ID/cacheConfig"
}

# Response if caching is disabled.
{
  "name": "projects/PROJECT_ID/cacheConfig"
  "disableCache": true
}

캐싱 사용 중지

다음 curl 명령어를 실행하여 Google Cloud 프로젝트에 대한 캐싱을 사용 중지합니다. 이 명령어를 실행하려면 사용자에게 Vertex AI 관리자 역할 roles/aiplatform.admin이 부여되어 있어야 합니다.

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt-out of caching.
$ curl -X PATCH -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": true
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_ID}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}

캐싱 사용 설정

Google Cloud 프로젝트에서 캐싱을 중지한 후 다시 사용 설정하려면 다음 curl 명령어를 실행합니다. 이 명령어를 실행하려면 사용자에게 Vertex AI 관리자 역할 roles/aiplatform.admin이 부여되어 있어야 합니다.

PROJECT_ID=PROJECT_ID
LOCATION_ID="us-central1"
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt in to caching.
$ curl -X PATCH     -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": false
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_NUMBER}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}

다음 단계

책임감 있는 AI 권장사항 및 Vertex AI 안전 필터 알아보기
Google Cloud 데이터 거버넌스의 Gemini 알아보기

생성형 AI 및 데이터 거버넌스 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.