Ringkasan ekstraksi

Document AI menawarkan beberapa produk untuk mengekstrak informasi dari dokumen untuk berbagai kasus penggunaan:

  • Parser Formulir
  • Ekstraktor kustom, yang menawarkan tiga jenis pemodelan yang berbeda:

    • Model dasar
    • Berbasis model kustom
    • Berdasarkan template kustom
  • Layout Parser

Form Parser

Pengurai Formulir mengekstrak pasangan nilai kunci (KVP), tabel, tanda pilihan (kotak centang), dan kolom generik untuk meningkatkan dan mengotomatiskan ekstraksi. Fitur ini dapat mengekstrak hingga 11 entitas dan kotak centang generik secara langsung. Anda tidak menentukan kolom (skema) yang ingin diekstrak dengan Form Parser. Model mendeteksi dan menampilkan entity yang relevan dari setiap halaman dokumen.

Pengekstrak kustom

Ekstraktor kustom mengekstrak entity yang Anda tentukan dalam skema dan menawarkan tiga opsi pemodelan: model dasar, berbasis model kustom, dan berbasis template kustom. Mengingat hasil yang menjanjikan dari model dasar dengan sedikit atau tanpa data pelatihan, sebaiknya mulai dengan model dasar sebagai opsi pertama dan coba opsi lain sesuai kebutuhan. Model dasar melakukan prediksi zero-shot hingga few-shot, berdasarkan hingga 5 dokumen berlabel dalam set data, dan prediksi yang di-fine-tune dengan lebih dari 10 dokumen berlabel dalam set data.

Metode pelatihan Contoh dokumen Variasi tata letak dokumen Teks atau paragraf bentuk bebas Jumlah dokumen pelatihan untuk kualitas siap produksi, bergantung pada variabilitas
Model dasar dan penyesuaian (AI generatif). Kontrak, persyaratan layanan, invoice, laporan mutasi bank, surat muatan kapal, slip gaji. Tinggi ke Rendah (lebih disukai). Tinggi. Sedang: 0-50+ dokumen.
Model kustom. Model. Formulir serupa dengan variasi tata letak di berbagai tahun atau vendor (misalnya, W9). Rendah hingga sedang. Rendah. Tinggi: 10-100+ dokumen.
Template. Formulir pajak dengan tata letak tetap (misalnya, Formulir 941 dan 709). Tidak ada. Rendah. Rendah (3 dokumen).

Karena model dasar biasanya memerlukan lebih sedikit dokumen pelatihan, model ini direkomendasikan sebagai opsi pertama untuk semua tata letak variabel.

Parser Tata Letak

Layout Parser mengonversi dokumen dalam berbagai format menjadi representasi terstruktur, sehingga konten seperti paragraf, tabel, daftar, dan elemen struktural seperti judul, header halaman, dan footer dapat diakses, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam berbagai aplikasi AI generatif dan penemuan.