Maksimum set data pelatihan: 300 dokumen, 300 halaman
Set data pelatihan minimum: setiap label pada minimal 3 dokumen
Batas maksimum set data pengujian: 2.000 dokumen; 8.000 halaman
Set data pengujian minimum: setiap label pada minimal 3 dokumen
Maksimum 20 halaman per dokumen
Batasan untuk melatih Pengklasifikasi Dokumen Kustom (CDC) atau Pemisah Dokumen Kustom (CDS)
Maksimum set data pelatihan: 30.000 dokumen; 100.000 halaman
Set data pelatihan minimum: setiap label pada minimal 10 dokumen
Batas maksimum set data pengujian: 2.000 dokumen; 8.000 halaman
Set data pengujian minimum: setiap label pada minimal 2 dokumen
Maksimum 200 halaman per dokumen
Pelabelan
Untuk memulai, pastikan label dokumen memenuhi nilai minimum pelatihan dan evaluasi yang ditentukan.
Untuk mulai mengevaluasi performa model untuk dokumen dengan variasi tata letak, beri label pada setidaknya 100 dokumen. Secara khusus, pastikan setiap label ada di 50 dokumen dalam pelatihan dan 50 dalam evaluasi.
Maksimum label (kolom) yang diizinkan: 150
Batas ukuran label (karakter): Item panjang tidak didukung dengan baik, tetapi tidak ada batas eksplisit. Pisahkan dokumen menjadi potongan 800 atau 1.000 token, dengan 100 hingga 200 token yang tumpang-tindih di antara potongan. (Item yang lebih panjang dari area tumpang-tindih mungkin mengalami masalah kualitas.)
Kejadian label dalam dokumen: Tidak ada batas
Cakupan geografis
Region yang umumnya didukung: AS, Uni Eropa (multi-region)
Wilayah dengan aksesibilitas terbatas: Jerman, Singapura, Inggris Raya, Kanada, India, Australia
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-04-01 UTC."],[[["Document AI has fixed system limits that cannot be adjusted, unlike quotas."],["Online processing requests have a maximum file size limit of 20 MB, while batch processing requests can handle files up to 1 GB each."],["The maximum image resolution for uploaded files is 40 megapixels per page, but this does not apply to PDF files."],["Batch processing requests are limited to a maximum of 5,000 files per request, with a maximum of 10 pages per document for Human-in-the-Loop processes."],["Training datasets for Custom Document Extractors, Classifiers, or Splitters have varying maximums, with limits for example, of up to 25,000 documents and 100,000 pages for model based training, with labels needing to be present on a specified minimum amount of documents, and a maximum of 200 pages per document."]]],[]]