생성형 AI 개요
이 문서에서는 BigQuery ML이 지원하는 생성형 인공지능(AI) 기능을 설명합니다. 이러한 기능을 사용하면 선행 학습된 Vertex AI 모델을 사용하여 BigQuery ML에서 AI 태스크를 수행할 수 있습니다. 지원되는 태스크는 다음과 같습니다.
Vertex AI 모델에 액세스하여 Vertex AI 모델의 엔드포인트를 나타내는 BigQuery ML에서 원격 모델을 생성하여 이러한 기능 중 하나를 수행합니다. 사용할 Vertex AI 모델에 대한 원격 모델을 만든 후에는 원격 모델에 대해 BigQuery ML 함수를 실행하여 해당 모델의 기능에 액세스합니다.
이 접근 방식을 사용하면 SQL 쿼리에서 이러한 Vertex AI 모델의 기능을 사용하여 BigQuery 데이터를 분석할 수 있습니다.
워크플로
Vertex AI 모델을 통한 원격 모델과 BigQuery ML 함수와 함께 Cloud AI 서비스를 통한 원격 모델을 사용하여 복잡한 데이터 분석 및 생성형 AI 태스크를 수행할 수 있습니다.
다음 다이어그램은 이러한 기능을 함께 사용할 수 있는 몇 가지 일반적인 워크플로를 보여줍니다.
텍스트 생성
텍스트 생성은 프롬프트 또는 데이터 분석을 기반으로 텍스트가 생성되는 생성형 AI의 한 형태입니다. 텍스트와 멀티모달 데이터를 모두 사용하여 텍스트 생성을 실행할 수 있습니다.
텍스트 생성의 몇 가지 일반적인 사용 사례는 다음과 같습니다.
- 창의적인 콘텐츠 생성
- 코드 생성 중입니다.
- 채팅 또는 이메일 응답 생성
- 브레인스토밍(예: 향후 제품 또는 서비스의 방향 제안)
- 제품 추천과 같은 콘텐츠 맞춤설정
- 콘텐츠에 하나 이상의 라벨을 적용하여 데이터를 분류하고 카테고리별로 정렬합니다.
- 콘텐츠에 표현된 주요 감정을 파악합니다.
- 콘텐츠에서 전달하는 주요 아이디어 또는 인상을 요약합니다.
- 텍스트 또는 시각적 데이터에서 하나 이상의 주요 항목을 식별합니다.
- 텍스트 또는 오디오 데이터의 콘텐츠를 다른 언어로 번역합니다.
- 오디오 데이터의 구두 콘텐츠와 일치하는 텍스트를 생성합니다.
- 시각적 데이터에 캡션을 추가하거나 질의응답을 수행합니다.
데이터 보강은 텍스트 생성 후 일반적으로 취하는 다음 단계로, 초기 분석의 통계를 추가 데이터와 결합하여 보강합니다. 예를 들어 가구 SKU에 mid-century modern
또는 farmhouse
와 같은 관련 설명이 포함되도록 가구 이미지를 분석하여 design_type
열의 텍스트를 생성할 수 있습니다.
지원되는 모델
지원되는 Vertex AI 모델은 다음과 같습니다.
gemini-1.5-flash
gemini-1.5-pro
gemini-1.0-pro
gemini-1.0-pro-vision
(미리보기)text-bison
text-bison-32k
text-unicorn
- Anthropic Claude 모델(미리보기)
프리뷰 모델에 대한 피드백을 제공하거나 지원을 요청하려면 bqml-feedback@google.com으로 이메일을 보내세요.
텍스트 생성 모델 사용
모델을 만든 후에는 ML.GENERATE_TEXT
함수를 사용하여 해당 모델과 상호작용할 수 있습니다.
gemini-1.5-flash
또는gemini-1.5-pro
모델을 기반으로 하는 원격 모델의 경우ML.GENERATE_TEXT
함수를 사용하여 함수 인수로 제공하는 프롬프트에서 객체 테이블의 텍스트, 이미지, 오디오, 비디오 또는 PDF 콘텐츠를 분석하거나 쿼리 또는 표준 테이블의 열에서 제공하는 프롬프트에서 텍스트를 생성할 수 있습니다.gemini-1.0-pro-vision
모델을 기반으로 하는 원격 모델의 경우ML.GENERATE_TEXT
함수를 사용하여 함수 인수로 제공하는 프롬프트에서 객체 테이블의 이미지 또는 동영상 콘텐츠를 분석할 수 있습니다.gemini-1.0-pro
,text-bison
,text-bison-32k
또는text-unicorn
모델을 기반으로 하는 원격 모델의 경우 쿼리 또는 표준 테이블의 열에서 제공하는 프롬프트에서ML.GENERATE_TEXT
함수를 사용할 수 있습니다.
입력에 표준 테이블을 사용하는 경우 ML.GENERATE_TEXT
함수로 Gemini 모델을 사용할 때 그라운딩 및 안전 속성을 사용할 수 있습니다. Gemini 모델은 그라운딩을 통해 인터넷의 추가 정보를 사용하여 보다 구체적이고 사실적인 응답을 생성할 수 있습니다. Gemini 모델은 안전 속성을 통해 지정된 속성을 기반으로 반환하는 응답을 필터링할 수 있습니다.
다음 모델 중 하나를 참조하는 원격 모델을 만들 때 선택적으로 지도 조정을 동시에 구성할 수 있습니다.
gemini-1.5-pro-002
gemini-1.5-flash-002
gemini-1.0-pro-002
(미리보기)
모든 추론은 Vertex AI에서 발생합니다. 결과는 BigQuery에 저장됩니다.
다음 주제를 사용하여 BigQuery ML에서 텍스트 생성을 시도해 보세요.
Gemini
모델과ML.GENERATE_TEXT
함수를 사용하여 텍스트 생성- Gemini 비전 모델을 사용하여 이미지 분석
- 데이터와 함께
ML.GENERATE_TEXT
함수를 사용하여 텍스트 생성 - 데이터를 사용하여 모델 조정
text-bison
모델과ML.GENERATE_TEXT
함수를 사용하여 텍스트 생성
임베딩 생성
임베딩은 텍스트 또는 오디오 파일의 일부와 같이 특정 항목을 나타내는 고차원의 숫자 벡터입니다. 임베딩을 생성하면 데이터를 더 쉽게 추론하고 비교할 수 있는 방식으로 데이터의 시맨틱을 포착할 수 있습니다.
임베딩 생성의 일반적인 사용 사례는 다음과 같습니다.
- 검색 증강 생성 (RAG)을 사용하여 신뢰할 수 있는 소스의 추가 데이터를 참조하여 사용자 쿼리에 대한 모델 응답을 보강합니다. RAG는 사실 정확성과 응답 일관성을 개선하고 모델의 학습 데이터보다 최신인 데이터에 액세스할 수 있도록 지원합니다.
- 멀티모달 검색 실행 예를 들어 텍스트 입력을 사용하여 이미지를 검색하는 경우
- 시맨틱 검색을 실행하여 추천, 대체, 레코드 중복 삭제를 위한 유사 항목을 찾습니다.
- 클러스터링을 위해 k-평균 모델과 함께 사용할 임베딩을 만듭니다.
지원되는 모델
지원되는 모델은 다음과 같습니다.
- 텍스트 임베딩을 만들려면 Vertex AI
text-embedding
및text-multilingual-embedding
모델을 사용하면 됩니다. - 텍스트, 이미지, 동영상을 동일한 시맨틱 공간에 삽입하는 멀티모달 임베딩을 만들려면 Vertex AI
multimodalembedding
모델을 사용하면 됩니다. - 구조화된 독립적이고 동일한 분포의 무작위 변수 (IID) 데이터의 임베딩을 만들려면 BigQuery ML 주요 구성요소 분석 (PCA) 모델 또는 Autoencoder 모델을 사용하면 됩니다.
- 사용자 또는 항목 데이터의 임베딩을 만들려면 BigQuery ML 행렬 분해 모델을 사용하면 됩니다.
비슷한 경량형 텍스트 임베딩의 경우 NNLM, SWIVEL, BERT와 같은 사전 학습된 TensorFlow 모델 사용을 시도해 보세요.
임베딩 생성 모델 사용
모델을 만든 후에는 ML.GENERATE_EMBEDDING
함수를 사용하여 모델과 상호작용할 수 있습니다. 지원되는 모든 유형의 모델에서 ML.GENERATE_EMBEDDING
은 표준 테이블의 데이터로 작동합니다. 멀티모달 임베딩 모델의 경우 ML.GENERATE_EMBEDDING
은 객체 테이블의 시각적 콘텐츠로도 작동합니다.
원격 모델의 경우 모든 추론은 Vertex AI에서 발생합니다. 다른 모델 유형의 경우 모든 추론이 BigQuery에서 발생합니다. 결과는 BigQuery에 저장됩니다.
다음 주제를 사용하여 BigQuery ML에서 텍스트 생성을 시도해 보세요.
ML.GENERATE_EMBEDDING
함수를 사용하여 텍스트 임베딩 생성ML.GENERATE_EMBEDDING
함수를 사용하여 이미지 임베딩 생성ML.GENERATE_EMBEDDING
함수를 사용하여 동영상 임베딩 생성- 멀티모달 임베딩 생성 및 검색
- 시맨틱 검색 및 검색 증강 생성 수행
다음 단계
- 머신러닝 모델에 대한 추론 수행에 관한 자세한 내용은 모델 추론 개요를 참조하세요.