Perilaku pemisah dokumen
Output prosesor pemisah berisi informasi pemisahan untuk dokumen input, termasuk skor keyakinan. Document AI API menghasilkan objek JSON
Document
, dan format output
menggunakan kolom entities
untuk
merepresentasikan pemisahan dokumen. Informasi tambahan bergantung pada jenis pemisah tertentu.
Entity.type
menentukan klasifikasi dokumen. Untuk mengetahui daftar lengkap jenis dokumen yang dapat diidentifikasi, lihat daftar berikut.Entity.pageAnchor.pageRefs[]
menentukan halaman yang berisi setiap sub-dokumen. Perhatikan bahwapageRefs[].page
berbasis nol dan merupakan indeks ke dalam kolomdocument.pages[]
.
Splitter tidak dirancang untuk memisahkan dokumen logis yang panjangnya lebih dari 30 halaman. Dokumen logis yang panjangnya lebih dari 30 halaman (misalnya, laporan bank 40 halaman) dapat dibagi menjadi dua dokumen atau lebih dan diklasifikasikan secara terpisah.
Pemisah mengidentifikasi batas halaman, tetapi tidak benar-benar memisahkan dokumen input untuk Anda. SDK Document AI Toolbox menyediakan fungsi utilitas yang dapat memisahkan dokumen input berdasarkan output dari pemroses pemisah.
Jenis dokumen yang diidentifikasi
[1] Parser yang sesuai untuk formulir ini tidak mendukung jenis dokumen ini. Artinya, pemisah dapat mengidentifikasi dan mengklasifikasikan dokumen jenis ini, tetapi Document AI tidak menyediakan parser untuk mengekstrak informasi.
Contoh output
Prosesor | Contoh output |
---|
Contoh Kode
Pemecah mengidentifikasi batas halaman, tetapi tidak benar-benar memecah dokumen input untuk Anda. Anda dapat menggunakan Toolbox Document AI untuk memisahkan file PDF secara fisik menggunakan batas halaman. Contoh kode berikut mencetak rentang halaman tanpa memisahkan PDF:
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Document
yang diproses.
Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.