프로세서 목록

이 페이지에는 Document AI에서 제공하는 모든 프로세서에 관한 자세한 정보가 포함되어 있습니다. 솔루션 유형별로 모든 프로세서 목록을 볼 수 있습니다.

모든 Document AI 프로세서는 데이터 처리 및 보안 약관을 준수합니다.

자세한 내용은 프로세서 버전 관리 문서를 참고하세요. 전체 제품 할당량 및 한도 외에 특정 프로세서 한도도 적용됩니다.

텍스트 디지털화

Enterprise Document OCR (광학 문자 인식)

설명

다양한 유형의 문서에서 텍스트를 식별하고 추출합니다.

이 프로세서를 사용하면 200개 이상의 언어로 된 문서에서 필기 텍스트를 포함한 텍스트를 식별하고 추출할 수 있습니다. 또한 프로세서는 머신러닝을 사용하여 콘텐츠의 가독성을 기반으로 문서의 품질을 평가합니다.

카테고리 디지털화
함수 OCR, 품질 분석
출시 단계 정식 버전
액세스 상태 공개
API 입력 OCR_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원
아프리칸스어 af Latn
알바니아어 sq Latn
아랍어 ar Arab
아르메니아어 hy Armn
벨라루스어 be Cyrl
벵골어 bn Beng
뱅골어 bn Beng
불가리아어 bg Cyrl
카탈로니아어 ca Latn
중국어 zh Hani
크로아티아어 hr Latn
체코 cs Latn
덴마크어 da Latn
네덜란드어 nl Latn
영어 en Latn
에스토니아어 et Latn
필리핀어 fil Latn
핀란드어 fi Latn
프랑스어 fr Latn
독일어 de Latn
그리스어 el Grek
구자라트어 gu Gujr
히브리어 iw Hebr
힌디어 hi Deva
헝가리어 hu Latn
아이슬란드어 is Latn
인도네시아어 id Latn
이탈리아어 it Latn
일본어 ja Jpan
칸나다어 kn Knda
크메르어 km Khmr
한국어 ko Kore
라오어 lo Laoo
라트비아어 lv Latn
리투아니아어 lt Latn
마케도니아어 mk Cyrl
말레이어 ms Latn
말라얄람어 ml Mlym
마라타어 mr Deva
네팔어 ne Deva
노르웨이어 no Latn
페르시아어 fa Arab
폴란드어 pl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
펀자브어 pa Guru
루마니아어 ro Latn
러시아어 ru Cyrl
세르비아어 sr Cyrl
슬로바키아어 sk Latn
슬로베니아어 sl Latn
스페인어 es Latn
스웨덴어 sv Latn
타갈로그어 tl Latn
타밀어 ta Taml
텔루구어 te Telu
태국어 th Thai
터키어 tr Latn
우크라이나어 uk Cyrl
베트남어 vi Latn
이디시어 yi Hebr
프로세서 버전
버전 ID 배포 채널 설명
pretrained-ocr-v1.2-2022-11-10 정식 고정된 모델 버전 1.0: 최대 18개월 동안 컨테이너 이미지에 고정된 버전 스냅샷의 모델 파일, 구성, 바이너리입니다.
pretrained-ocr-v2.0-2023-06-02 정식 문서 사용 사례에 특화된 프로덕션 지원 모델입니다. 모든 OCR 부가기능에 대한 액세스가 포함됩니다.
pretrained-ocr-v2.1-2024-08-07 정식 v2.1의 주요 개선사항은 인쇄된 텍스트 인식 개선, 더 정확한 체크박스 감지, 더 정확한 읽기 순서입니다.
pretrained-ocr-v2.1.1-2025-01-31 출시 후보 v2.1.1은 v2.1과 유사하며 US, EU, asia-southeast1를 제외한 모든 리전에서 사용할 수 있습니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 500
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 Enterprise Document OCR

문서에서 항목을 추출합니다.

학습에 사용할 라벨이 지정된 데이터 세트와 라벨이 지정되지 않은 데이터 세트의 샘플은 샘플 데이터 세트를 참고하세요.

맞춤 추출기

설명

생성형 AI 또는 맞춤 모델을 사용하여 문서에서 필드를 추출하고, 모델을 미세 조정하여 문서에서 데이터를 정확하게 추출합니다.

카테고리 추출
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 CUSTOM_EXTRACTION_PROCESSOR
참고
  • 추출에 생성형 AI를 사용하는 경우 다음을 충족해야 합니다.

    • 영어만 공식적으로 지원됩니다.
    • 리전은 US, EU, northamerica-northeast1, asia-southeast1에서 사용할 수 있습니다.

지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원
아프리칸스어 af Latn
아랍어 ar Arab
아제르바이잔어 az Latn
아제르바이잔어 (키릴 문자) az-Cyrl Cyrl
벨라루스어 be Cyrl
불가리아어 bg Cyrl
보스니아어 bs Latn
카탈로니아어 ca Latn
세부아노어 ceb Latn
체코 cs Latn
웨일즈어 cy Latn
덴마크어 da Latn
독일어 de Latn
그리스어 el Grek
영어 en Latn
에스페란토어 eo Latn
스페인어 es Latn
에스토니아어 et Latn
바스크어 eu Latn
페르시아어 fa Arab
핀란드어 fi Latn
필리핀어 fil Latn
프랑스어 fr Latn
아일랜드어 ga Latn
갈리시아어 gl Latn
힌디어 hi Deva
크로아티아어 hr Latn
아이티 크리올어 ht Latn
헝가리어 hu Latn
인도네시아어 id Latn
아이슬란드어 is Latn
이탈리아어 it Latn
히브리어 iw Hebr
일본어 ja Jpan
자바어 jv Latn
카자흐어 kk Cyrl
한국어 ko Kore
키르기스어 ky Cyrl
라틴어 la Latn
리투아니아어 lt Latn
라트비아어 lv Latn
마케도니아어 mk Cyrl
몽골어 mn Cyrl
마라타어 mr Deva
말레이어 ms Latn
몰타어 mt Latn
네팔어 ne Deva
네덜란드어 nl Latn
노르웨이어 no Latn
폴란드어 pl Latn
파슈토어 ps Arab
포르투갈어 (포르투갈 및 브라질) pt Latn
루마니아어 ro Latn
러시아어 ru Cyrl
러시아어 (페트린 철자법) ru-PETR1708 Cyrl
산스크리트 sa Deva
슬로바키아어 sk Latn
슬로베니아어 sl Latn
알바니아어 sq Latn
세르비아어 sr Cyrl
스웨덴어 sv Latn
스와힐리어 sw Latn
타갈로그어 tl Latn
터키어 tr Latn
우크라이나어 uk Cyrl
우르두어 ur Arab
우즈베크어 uz Latn
우즈베크어(키릴 문자) uz-Cyrl Cyrl
베트남어 vi Latn
이디시어 yi Hebr
중국어(간체) zh-Hans Hani
중국어(번체) zh-Hant Hani
줄루어 zu Latn
프로세서 버전
버전 ID 배포 채널 설명
pretrained-foundation-model-v1.4-2025-02-05 정식 Gemini 2.0 Flash LLM으로 구동되는 프로덕션 지원 후보입니다. 체크박스 감지와 같은 고급 OCR 기능도 포함되어 있습니다.
pretrained-foundation-model-v1.5-2025-05-05 정식 Gemini 2.5 Flash LLM으로 구동되는 프로덕션 지원 후보입니다. 최신 모델을 실험해 보려는 사용자에게 권장됩니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
정규화된 데이터 유형

자세한 내용은 강화 및 정규화데이터 세트 만들기 페이지를 참고하세요.

정규화된 데이터 유형의 전체 목록
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 맞춤 추출기

양식 파서

설명

OCR 텍스트 외에도 문서에서 일반 키-값 쌍 (항목 및 체크박스), 표, 일반 항목을 추출합니다.

이 프로세서는 고급 머신러닝 기술을 적용하여 200개 이상의 언어로 된 문서에서 키-값 쌍, 체크박스, 표를 추출합니다. 또한 이 프로세서는 딥 러닝 모델을 활용하여 다양한 문서 유형에 일반적으로 포함되는 11개의 일반 항목을 추출합니다.

카테고리 추출
함수 OCR, 양식 파싱, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 FORM_PARSER_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원
아프리칸스어 af Latn
알바니아어 sq Latn
아랍어 ar Arab
벨라루스어 be Cyrl
카탈로니아어 ca Latn
중국어 zh Hani
크로아티아어 hr Latn
체코 cs Latn
덴마크어 da Latn
네덜란드어 nl Latn
영어 en Latn
에스토니아어 et Latn
필리핀어 fil Latn
핀란드어 fi Latn
프랑스어 fr Latn
독일어 de Latn
히브리어 iw Hebr
힌디어 hi Deva
헝가리어 hu Latn
아이슬란드어 is Latn
인도네시아어 id Latn
이탈리아어 it Latn
일본어 ja Jpan
한국어 ko Kore
라트비아어 lv Latn
리투아니아어 lt Latn
마케도니아어 mk Cyrl
말레이어 ms Latn
마라타어 mr Deva
네팔어 ne Deva
노르웨이어 no Latn
페르시아어 fa Arab
폴란드어 pl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
루마니아어 ro Latn
러시아어 ru Cyrl
세르비아어 sr Cyrl
슬로바키아어 sk Latn
슬로베니아어 sl Latn
스페인어 es Latn
스웨덴어 sv Latn
타갈로그어 tl Latn
터키어 tr Latn
우크라이나어 uk Cyrl
베트남어 vi Latn
이디시어 yi Hebr
프로세서 버전
버전 ID 배포 채널 추가 필드가 감지됨 설명
pretrained-form-parser-v1.0-2020-09-23 정식

없음

기존 버전입니다. 최고의 품질과 전체 기능 집합을 사용하려면 양식 파서 v2.0을 사용하세요.
pretrained-form-parser-v2.0-2022-11-10 정식
필드 표시
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
권장 버전입니다. 일반 항목을 지원하고 업그레이드된 표, KVP, 체크박스 모델과 200개가 넘는 언어를 포함합니다.
pretrained-form-parser-v2.1-2023-06-26 출시 후보

없음

공개 미리보기 버전입니다. 디지털 PDF 파일에서 기본 텍스트 추출이 사용 설정된 v2.0과 동일한 모델입니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 100
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 양식 파서

레이아웃 파서

설명

문서 콘텐츠 요소 (텍스트, 표, 목록)를 추출하고 컨텍스트 인식 청크를 만듭니다.

레이아웃 파서는 텍스트, 표, 목록과 같은 문서 콘텐츠 요소를 추출하고 생성형 AI 및 탐색 애플리케이션에서 정보 검색을 용이하게 하는 컨텍스트 인식 청크를 만듭니다.

카테고리 추출
함수 레이아웃 파싱, 문서 청크 처리
출시 단계 정식 버전
액세스 상태 공개
API 입력 LAYOUT_PARSER_PROCESSOR
참고
  • 이 파서는 PDF, HTML, DOCX 파일을 지원합니다.
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원
아프리칸스어 af Latn
알바니아어 sq Latn
아랍어 ar Arab
아르메니아어 hy Armn
벨라루스어 be Cyrl
벵골어 bn Beng
뱅골어 bn Beng
불가리아어 bg Cyrl
카탈로니아어 ca Latn
중국어 zh Hani
크로아티아어 hr Latn
체코 cs Latn
덴마크어 da Latn
네덜란드어 nl Latn
영어 en Latn
에스토니아어 et Latn
필리핀어 fil Latn
핀란드어 fi Latn
프랑스어 fr Latn
독일어 de Latn
그리스어 el Grek
구자라트어 gu Gujr
히브리어 iw Hebr
힌디어 hi Deva
헝가리어 hu Latn
아이슬란드어 is Latn
인도네시아어 id Latn
이탈리아어 it Latn
일본어 ja Jpan
칸나다어 kn Knda
크메르어 km Khmr
한국어 ko Kore
라오어 lo Laoo
라트비아어 lv Latn
리투아니아어 lt Latn
마케도니아어 mk Cyrl
말레이어 ms Latn
말라얄람어 ml Mlym
마라타어 mr Deva
네팔어 ne Deva
노르웨이어 no Latn
페르시아어 fa Arab
폴란드어 pl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
펀자브어 pa Guru
루마니아어 ro Latn
러시아어 ru Cyrl
세르비아어 sr Cyrl
슬로바키아어 sk Latn
슬로베니아어 sl Latn
스페인어 es Latn
스웨덴어 sv Latn
타갈로그어 tl Latn
타밀어 ta Taml
텔루구어 te Telu
태국어 th Thai
터키어 tr Latn
우크라이나어 uk Cyrl
베트남어 vi Latn
이디시어 yi Hebr
프로세서 버전
버전 ID 배포 채널 설명
pretrained-layout-parser-v1.0-2024-06-03 정식 권장 버전입니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 500
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us
추가 정보 레이아웃 파서

선행 학습된 프로세서 살펴보기

은행 명세서 파서

설명

은행 명세서에서 이름, 계좌, 거래 내역 등 추출

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 BANK_STATEMENT_PROCESSOR
참고
  • 다중 페이지 입력 파일의 페이지가 올바른 문서 유형이고 지원되는 버전 중 하나인 경우 프로세서가 지원되는 첫 번째 문서에서 엔티티 추출을 실행합니다. 프로세서가 입력 파일에서 적용 가능한 문서를 찾지 못하면 오류 메시지를 반환합니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
프로세서 버전
버전 ID 배포 채널 설명
pretrained-bankstatement-v1.0-2021-08-08 정식
pretrained-bankstatement-v1.1-2021-08-13 정식
pretrained-bankstatement-v2.0-2021-12-10 정식
pretrained-bankstatement-v3.0-2022-05-16 정식 이 버전에서는 입력 파일에 은행 명세서가 하나만 포함되어 있다고 가정합니다. 기본 버전과 달리 이 버전은 은행 명세서의 입력 파일을 확인하지 않으며 은행 명세서가 없어도 오류를 반환하지 않습니다.
pretrained-bankstatement-v4.0-2023-07-31 출시 후보
pretrained-bankstatement-v5.0-2023-12-06 출시 후보

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 30
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
강화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • bank_address
  • bank_name
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

W2 파서

설명

W2 양식에서 직원, 고용주, 임금 등 추출

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 FORM_W2_PROCESSOR
참고
  • 다중 페이지 입력 파일의 페이지가 올바른 문서 유형이고 지원되는 버전 중 하나인 경우 프로세서가 지원되는 첫 번째 문서에서 엔티티 추출을 실행합니다. 프로세서가 입력 파일에서 적용 가능한 문서를 찾지 못하면 오류 메시지를 반환합니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
지원되는 양식/버전
  • 2020년 (표준 및 맞춤 버전)
  • 2019 (표준 및 맞춤 버전)
  • 2018년 (표준 및 맞춤 버전)
프로세서 버전
버전 ID 배포 채널 추가 필드가 감지됨 설명
pretrained-w2-v1.0-2020-10-01 정식

없음

pretrained-w2-v1.1-2022-01-27 정식

없음

pretrained-w2-v1.2-2022-01-28 정식
필드 표시
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

품질 개선 및 새 필드 지원, 스플리터는 포함되지 않음

pretrained-w2-v2.0-2022-03-30 출시 후보
필드 표시
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

품질 개선과 12번 상자 필드 지원, EmployeeName, EmployeeAddress, EmployerNameAndAddress의 세부 예측이 이루어졌으며, 이 모든 항목은 더 이상 출력의 일부가 아니며 추가 필드로 대체되었습니다.

pretrained-w2-v2.1-2022-06-08 정식
필드 표시
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

버전 pretrained-w2-v2.0-2022-03-30과 유사하며 품질이 더욱 향상되었고 항목 EmployeeName_Suffix이 하나 더 도입되었습니다.

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 15
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 15
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
강화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • EmployerNameAndAddress
  • EIN
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

미국 여권 파서

설명

이름, 문서 ID, 생년월일 등의 필드를 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 US_PASSPORT_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
프로세서 버전
버전 ID 배포 채널 설명
pretrained-us-passport-v1.0-2021-06-14 정식

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 2
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

공과금 파서

설명

공과금 청구서에서 공급업체 이름, 이전 결제 금액 등의 텍스트 및 값을 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 제한적 [*]
API 입력 UTILITY_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
프로세서 버전
버전 ID 배포 채널 설명
pretrained-utility-v1.1-2021-04-09 정식
pretrained-utility-v1.2-2022-12-15 출시 후보

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 10
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

신분증 증명 파서

설명

여러 신호를 사용하여 신분증의 유효성을 예측합니다.

신원 증명 문서 검증 프로세서는 다음과 같은 4개의 신호를 토대로 신분증의 유효성 예측을 지원하도록 설계되었습니다.

현재 프로세서는 다음 신호의 정보를 반환합니다.

  • fraud_signals_is_identity_document 감지: 이미지에 인식된 신분증이 포함되어 있는지 여부를 예측합니다.
  • fraud_signals_suspicious_words 감지: 신분증에 일반적으로 사용되지 않는 단어가 있는지 여부를 예측합니다.
  • fraud_signals_image_manipulation 감지: 이미지가 이미지 편집 도구를 통해 변경 또는 변조되었는지 여부를 예측합니다.
  • fraud_signals_online_duplicate 감지: 이미지를 온라인에서 찾을 수 있는지 여부를 예측합니다 (미국만 해당).

카테고리 선행 학습됨
함수 OCR, 품질 분석
출시 단계 정식 버전
액세스 상태 공개
API 입력 ID_PROOFING_PROCESSOR
참고
  • 온라인 중복 감지 기능은 현재 미국 데이터 센터에서 처리됩니다. 미국 이외의 지역에서는 이 기능에 대한 리전 및 멀티 리전 지원이 제공되지 않습니다.
  • 이 프로세서는 새 프로세서 버전이 출시되는 것보다 더 자주 업데이트되는 알고리즘에 의해 지원됩니다. 따라서 동일한 프로세서 버전을 사용하더라도 시간이 지남에 따라 프로세서에서 다른 출력을 반환할 수 있습니다. 예를 들어 온라인 중복 감지 시스템은 웹에 있는 이미지를 모니터링합니다. 그러면 시스템의 동작이 프로세서 버전에서 추적할 수 있는 것보다 더 빠르게 변경될 수 있습니다.
  • 책임감 있는 AI[†] 및 인적 검토[‡]에 관한 참고사항을 참고하세요.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
지원되는 양식/버전
  • 미국 여권, 패스카드, 운전면허증 지원
프로세서 버전
버전 ID 배포 채널 추가 필드가 감지됨 설명
pretrained-id-proofing-v1.0-2022-10-03 정식

없음

pretrained-id-proofing-v1.1-2023-05-18 출시 후보
필드 표시
  • fraud_signals_photocopy_detection

추가 복사본 감지 신호

pretrained-id-proofing-v1.2-2023-10-04 출시 후보
필드 표시
  • fraud_signals_photocopy_detection

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 2
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

급여 명세서 파서

설명

급여 명세서에서 이름, 업체명, 금액 등 추출

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 PAYSTUB_PROCESSOR
참고
  • 여러 페이지로 구성된 입력 문서에 유효한 급여 명세서가 두 개 이상 포함된 경우 프로세서는 첫 번째 유효한 급여 명세서에서만 항목을 추출합니다. 입력 파일에 급여 명세서가 없으면 프로세서에서 오류 메시지를 반환합니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
프로세서 버전
버전 ID 배포 채널 추가 필드가 감지됨 설명
pretrained-paystub-v1.0-2021-03-19 정식

없음

pretrained-paystub-v1.1-2021-08-13 정식
필드 표시
  • net_pay
  • net_pay_ytd
  • employee_account_number
품질 개선 및 새 필드 지원
pretrained-paystub-v1.2-2021-12-10 정식

없음

pretrained-paystub-v2.0-2022-05-17 출시 후보
필드 표시
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

이 버전에서는 입력 파일에 단일 급여 명세서가 포함되어 있다고 가정합니다. 기본 버전과 달리 이 버전은 급여 명세서에 대한 입력 파일을 확인하지 않으며 급여 명세서가 없어도 오류를 반환하지 않습니다.

품질 개선, 새 필드 지원, 새 스키마 보너스, 수수료, 휴일, 초과근무, 정규 급여, 휴가가 이제 earning_item/earning_this_period에 포함되며, 올해 누계 버전은 earning_item/earning_ytd에 포함됩니다. 이제 Direct Deposit(직접 입금) 및 Employee Account Number(직원 계정 번호)가 direct_deposit_item 아래에 중첩됩니다.

비동기 페이지 제한은 10입니다.

pretrained-paystub-v2.0-2022-07-22 정식

없음

품질 개선 및 업트레이닝 개선사항

pretrained-paystub-v3.0-2023-12-06 출시 후보

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 50
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
강화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • employer_address
  • employer_name
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
라벨 지정 안내 새 창에서 열기
지원되는 지역
  • eu
  • us

미국 운전면허증 파서

설명

이름, 문서 ID, 생년월일 등의 필드를 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 US_DRIVER_LICENSE_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
지원되는 양식/버전
  • 50개 주 및 D.C.를 모두 지원합니다.
프로세서 버전
버전 ID 배포 채널 설명
pretrained-us-driver-license-v1.0-2021-06-14 정식

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 2
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • eu
  • us

지출 파서

설명

지출 문서에서 지출 날짜, 공급업체 이름, 총액, 통화 등의 텍스트 및 값을 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 EXPENSE_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원
독일어 de Latn
영어 en Latn
스페인어 es Latn
프랑스어 fr Latn
일본어 ja Jpan
네덜란드어 nl Latn
프로세서 버전
버전 ID 배포 채널 추가 필드가 감지됨 추가 언어 지원 설명
pretrained-expense-v1.1-2021-04-09 정식

없음

없음

2021년 4월에 출시되었습니다.
pretrained-expense-v1.3.2-2024-09-11 출시 후보
필드 표시
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: 일본어
기본 비전 모델이 개선된 v1.3으로 업그레이드
pretrained-expense-v1.4-2022-11-18 출시 후보
필드 표시
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 일본어
  • it: 이탈리아어
  • pt: 포르투갈어 (포르투갈 및 브라질)
성능 개선 및 업트레이닝 지원 최대 페이지 수 (온라인/동기 요청) 한도가 15로 증가했습니다.
pretrained-expense-v1.4.2-2024-09-12 출시 후보
필드 표시
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 일본어
  • it: 이탈리아어
  • pt: 포르투갈어 (포르투갈 및 브라질)
기본 비전 모델이 개선된 v1.4로 업그레이드

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 10
최대 페이지 수 (일괄/오프라인/비동기 요청): 10
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 10
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
강화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • supplier_address
  • supplier_name
  • supplier_phone
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

인보이스 파서

설명

인보이스에서 인보이스 번호, 공급업체 이름, 인보이스 금액, 세액, 인보이스 날짜, 마감일 등의 텍스트 및 값을 추출합니다.

인보이스 파서는 인보이스 번호, 공급업체 이름, 인보이스 금액, 세액, 인보이스 날짜, 마감일, 항목 금액과 같은 헤더 및 항목 필드를 모두 추출합니다.

카테고리 선행 학습됨
함수 OCR, 항목 추출
출시 단계 정식 버전
액세스 상태 공개
API 입력 INVOICE_PROCESSOR
지원되는 언어
전체 언어 목록
언어 이름 BCP 47 태그 스크립트 필기 지원
독일어 de Latn
영어 en Latn
스페인어 es Latn
에스토니아어 et Latn
프랑스어 fr Latn
이탈리아어 it Latn
라트비아어 lv Latn
리투아니아어 lt Latn
네덜란드어 nl Latn
포르투갈어 (포르투갈 및 브라질) pt Latn
루마니아어 ro Latn
스웨덴어 sv Latn
프로세서 버전
버전 ID 배포 채널 추가 언어 지원 설명
pretrained-invoice-v1.1-2021-04-09 정식

없음

pretrained-invoice-v1.2-2022-02-18 정식

없음

곧 지원 중단될 예정입니다.
pretrained-invoice-v1.3-2022-07-15 정식
  • it: 이탈리아어
  • pt: 포르투갈어 (포르투갈 및 브라질)
  • ro: 루마니아어
  • sv: 스웨덴어
  • et: 에스토니아어
  • lv: 라트비아어
  • lt: 리투아니아어
업트레이닝 가능한 프로세서 버전입니다. 최대 페이지 수 (온라인/동기 요청)가 15로 증가했습니다.
pretrained-invoice-v1.4-2022-10-21 출시 후보

없음

업트레이닝 가능한 프로세서 버전입니다. 최대 페이지 수 (온라인/동기 요청)가 15로 증가했습니다.
pretrained-invoice-v1.5-2023-09-15 출시 후보

없음

pretrained-invoice-v2.0-2023-12-06 출시 후보

없음

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
가장 초기 버전에서 감지된 필드

이 정보는 감지된 필드 페이지에서도 확인할 수 있습니다.

전체 필드 목록
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
강화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정보가 추가된 필드의 전체 목록
  • supplier_address
  • supplier_name
  • supplier_phone
정규화된 필드

자세한 내용은 강화 및 정규화 페이지를 참고하세요.

정규화된 필드의 전체 목록
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
라벨 지정 안내 새 창에서 열기
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

문서 분류

커스텀 분류 기준

설명

클래스 집합에서 문서 유형을 분류하도록 모델을 학습시킵니다.

카테고리 분류
함수 OCR, 분류
출시 단계 정식 버전
액세스 상태 공개
API 입력 CUSTOM_CLASSIFICATION_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 맞춤 분류 프로세서 만들기

커스텀 분할기

설명

여러 문서가 포함된 파일을 분류된 개별 문서로 분할하도록 모델을 학습시킵니다.

카테고리 분류
함수 OCR, 분류, 분할
출시 단계 정식 버전
액세스 상태 공개
API 입력 CUSTOM_SPLITTING_PROCESSOR
참고
  • i18n은 맞춤 학습 옵션을 통해서만 지원할 수 있습니다.
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 1000
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
추가 정보 맞춤 스플리터 프로세서 만들기

문서 요약

요약 도구

설명

짧은 문서와 긴 문서의 초록 및 글머리 기호 요약을 가져옵니다.

카테고리 사전 학습
함수 요약
출시 단계 미리보기
액세스 상태 공개
API 입력 SUMMARY_PROCESSOR
지원되는 언어
언어 이름 BCP 47 태그 스크립트 필기 지원
영어 en Latn
프로세서 버전
버전 ID 배포 채널 설명
pretrained-foundation-model-v1.0-2023-08-22 정식 Google 파운데이션 모델

자세한 내용은 프로세서 버전 관리를 참고하세요.

할당량 및 한도
최대 페이지 수 (온라인/동기 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 250
최대 페이지 수 (이미지 없는 모드 온라인/동기 요청): 30
Uptraining
샘플 입력 파일 새 창에서 열기
샘플 출력 새 창에서 열기
지원되는 지역
  • us
추가 정보 맞춤 요약 도구

각주

[*] 이 프로세서는 제한된 액세스 권한이 있는 고객만 사용할 수 있습니다.

API 액세스를 요청하려면 Document AI 제한적 액세스 고객 요청 양식을 작성하여 제출하세요. 이 양식에는 귀하, 귀하의 회사, 사용 사례에 대한 정보를 입력해야 합니다. 액세스하려면 Google Cloud 프로젝트 ID가 필요합니다. 새 Google Cloud 프로젝트를 만들거나 기존 프로젝트의 프로젝트 ID를 확인하려면 다음 안내를 참조하세요.

양식을 제출하면 Document AI팀에서 요청을 검토하여 액세스 기준을 충족하는지 확인합니다. 승인되면 이 기능에 액세스하고 사용하는 방법에 대한 안내 이메일이 전송됩니다.

[†] 신원 증빙 서류 검증은 입력 이미지가 실제 신분증을 나타내는지 식별하는 데 도움이 되는 정보를 신분증 서류에서 추출하고 평가하는 방식으로 작동합니다.

Google Cloud에서는 고객이 AI 솔루션을 안전하게 개발하고 구현하도록 돕는 데 우선순위를 두고 있으며, 신원 확인은 Google의 AI 원칙에 따라 개발되었습니다.

Google의 AI 원칙과 현재 제품 설계를 바탕으로 다음의 경우 신중하게 고려하고 신원 증빙 사용의 잠재적 이점과 위험을 주의 깊게 평가하는 것이 좋습니다.

  • 인권에 영향을 미칠 수 있는 예측에 대해 사람이 개입하지 않는 의사결정
  • 민감한 도메인(예: 고용, 공공 서비스 이용, 의료, 안전이 중요한 맥락)

[‡] 더 광범위한 신원 감지 프로세스 및 워크플로의 일부로 항상 신원 증명을 사용하세요. 예측된 신호가 정확한지 확인하기 위해 워크플로에 사람 검토자가 있어야 합니다. 신원 증명 프로세서는 워크플로에서 ID의 사람 검토를 대체하기 위한 것이 아니라 사람 검토자가 ID 문서를 검증하도록 지원하기 위한 것입니다. 신원 증명 프로세서는 신분증의 유효성을 판단하는 자동 결정 도구로 사용해서는 안 됩니다. 사람의 검토를 통해 고객은 문서 처리 정확성을 높일 수 있으며, 기업은 이러한 검토를 사용 설정하기 위해 특화된 도구를 사용하여 예측을 평가할 수 있습니다.

이 기술을 구현하는 지역의 규정을 검토하고 기존 업계 가이드를 조사하여 정책 가이드라인과 일반적인 공정성 문제를 파악하세요. 학습 데이터 세트의 편향을 줄이고, 커스텀 모델의 성능 차이를 평가하고, 커스텀 모델을 사용할 때 고려할 사항 등 머신러닝의 공정성에 대해 알아보세요.

고객은 신원 확인을 구현할 때 공정성, 해석 가능성, 개인 정보 보호 및 보안 권장사항을 염두에 두는 것이 좋습니다. 책임감 있는 AI를 구현하는 방법을 자세히 알아보려면 Google의 책임감 있는 AI 관행 권장사항을 참고하세요.

사용 사례 및 샘플 애플리케이션 코드 저장소에 대한 자세한 내용은 블로그 게시물 Document AI를 사용하여 신분증 처리 자동화를 참고하세요.