한도

이 문서에서는 Document AI에 적용되는 시스템 한도를 설명합니다. 할당량과 달리 시스템 한도는 변경할 수 없습니다.

콘텐츠 한도

다음 콘텐츠 제한은 모든 Document AI 프로세서에 적용됩니다.

콘텐츠 한도
최대 이미지 해상도
(PDF 파일에는 제한사항이 적용되지 않음)
40메가픽셀 (이미지에 여러 페이지가 포함된 경우 페이지당)
온라인 처리 요청의 최대 파일 크기 20MB
일괄 처리 요청의 최대 파일 크기 1GB
일괄 처리 요청당 파일 수 파일 5,000개
문서당 인간 참여형(Human-In-The-Loop) 페이지 10페이지

프로세서 한도

한도는 현재 목록에 정의됩니다.

추출 프로세서

프로세서 한도
맞춤 추출기
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
양식 파서
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 100
레이아웃 파서
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 500

분류 프로세서

프로세서 한도
맞춤 분류 기준
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
맞춤 분할기
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 1000

프로세서 디지털화

프로세서 한도
Enterprise Document OCR (문서 OCR, 광학 문자 인식)
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 500

사전 학습된 프로세서

프로세서 한도
은행 명세서 파서
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 30
W2 파서
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 15
미국 여권 파서
최대 페이지 수 (온라인/동기식 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
유틸리티 파서
최대 페이지 수 (온라인/동기식 요청): 10
최대 페이지 수 (일괄/오프라인/비동기 요청): 200
신분증 증명 파서
최대 페이지 수 (온라인/동기식 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
급여 명세서 파서
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 50
미국 운전면허증 파서
최대 페이지 수 (온라인/동기식 요청): 2
최대 페이지 수 (일괄/오프라인/비동기 요청): 2
지출 파서
최대 페이지 수 (온라인/동기식 요청): 10
최대 페이지 수 (일괄/오프라인/비동기 요청): 10
인보이스 파서
최대 페이지 수 (온라인/동기식 요청): 15
최대 페이지 수 (일괄/오프라인/비동기 요청): 200

Document AI 제한사항

Document AI에는 현재 다음과 같은 제한사항이 있습니다.

기준 2023년 7월 안정화 버전
데이터 세트
  • 총 30,000개 이하의 문서
  • 총 250,000페이지까지
문서 가져오기
  • 가져오기당 최대 5,000개의 문서
  • 문서당 최대 200페이지
커스텀 문서 추출기 (CDE) 학습 제한사항 모델 기반 학습 (GA)
  • 학습 데이터 세트 최대값: 문서 25,000개, 페이지 100,000개
  • 학습 데이터 세트 최솟값: 각 라벨은 문서 10개당 1개 이상의 라벨에 있어야 합니다.
  • 테스트 데이터 세트 최대값: 문서 2,000개, 페이지 8,000개
  • 테스트 데이터 세트 최소값: 10개 이상의 문서에 있는 모든 라벨
  • 문서당 최대 200페이지

템플릿 기반 학습 (GA)
  • 학습 데이터 세트 최대값: 문서 300개, 페이지 300개
  • 학습 데이터 세트 최소값: 3개 이상의 문서에 모든 라벨이 지정됨
  • 테스트 데이터 세트 최대값: 문서 2,000개, 페이지 8,000개
  • 테스트 데이터 세트 최소값: 3개 이상의 문서에 있는 모든 라벨
  • 문서당 최대 20페이지
커스텀 문서 분류기 (CDC) 또는 커스텀 문서 분할기 (CDS) 학습 한도
  • 학습 데이터 세트 최대값: 문서 30,000개, 페이지 100,000개
  • 학습 데이터 세트 최소값: 10개 이상의 문서에 모든 라벨이 지정됨
  • 테스트 데이터 세트 최대값: 문서 2,000개, 페이지 8,000개
  • 테스트 데이터 세트 최소값: 2개 이상의 문서에 있는 모든 라벨
  • 문서당 최대 200페이지
라벨 지정
  • 시작하려면 문서 라벨이 정의된 최소 학습 및 평가 기준을 충족하는지 확인합니다.
  • 레이아웃이 다른 문서의 모델 성능 평가를 시작하려면 최소 100개의 문서에 라벨을 지정하세요. 특히 각 라벨이 학습의 경우 문서 50개, 평가의 경우 문서 50개에 있는지 확인합니다.
  • 허용되는 최대 라벨 (입력란): 150개
  • 라벨 크기 제한 (문자): 긴 항목은 잘 지원되지 않지만 명시적인 제한은 없습니다. 문서를 800개 또는 1,000개 토큰 조각으로 청크 처리하고 청크 간에 100~200개 토큰이 중복되도록 합니다. 겹치는 영역보다 긴 항목은 품질 문제가 발생할 수 있습니다.
  • 문서의 라벨 발생 횟수: 제한 없음
뉴스 보도 지역
  • 일반적으로 지원되는 리전: 미국, EU (멀티 리전)
  • 액세스가 제한된 지역: 독일, 싱가포르, 영국, 캐나다, 인도, 오스트레일리아