Pengekstrak kustom dengan AI generatif

Deteksi tanda tangan dan kolom turunan

Fitur kolom turunan pratinjau publik memungkinkan pelanggan Document AI mengonfigurasi kolom yang akan diisi melalui inferensi atau pembuatan cerdas berdasarkan konteks dokumen, bukan ekstraksi teks langsung.

Rilis ini juga menambahkan fitur lain untuk mendeteksi keberadaan tanda tangan dalam dokumen. Anda dapat menggunakan jenis entity signature baru untuk menentukan skema bagi entity tersebut. Entitas tanda tangan berasal dari petunjuk visual dari dokumen.

Kolom turunan di pengekstrak kustom

Ekstraktor kustom mendukung kolom turunan dalam model berikut:

  • pretrained-foundation-model-v1.4-2025-02-05 sebagai Ketersediaan Umum (GA)
  • pretrained-foundation-model-v1.5-2025-05-05 sebagai Pratinjau
  • pretrained-foundation-model-v1.5-pro-2025-06-20 sebagai Pratinjau

Anda dapat mengaktifkan fitur ini di UI konsol saat membuat atau mengedit label dalam skema dokumen.

Kolom Turunan adalah fitur canggih yang memungkinkan Anda mengekstrak informasi yang tidak ditulis secara eksplisit dalam dokumen. Dengan begitu, Anda dapat mengonfigurasi kolom agar diisi melalui inferensi atau pembuatan cerdas berdasarkan konteks keseluruhan dokumen. Hal ini melampaui ekstraksi teks dasar dan mendukung kasus penggunaan lanjutan, seperti:

  • Menyimpulkan negara dari alamat.
  • Menghitung jumlah total item dalam tabel.
  • Mendeteksi apakah kartu identitas adalah "ID Asli".

Contoh pembuatan skema

Berikut adalah contoh pembuatan skema untuk kolom turunan untuk kasus penggunaan tersebut dan output yang diharapkan, menggunakan surat izin mengemudi AS.

  1. Pilih metode Derived saat membuat elemen skema.

    cde-signature-detection-derived-field-1

  2. Tambahkan label deskriptif untuk meningkatkan performa.

    cde-signature-detection-derived-field-2

  3. Kolom turunan seperti tanda tangan tidak memerlukan penetapan kotak pembatas saat memberi label pada dokumen. Untuk Nilai, pilih Terdeteksi.

    cde-signature-detection-derived-field-3

  4. Untuk kolom turunan selain tanda tangan, Anda dapat memasukkan Nilai apa pun sebagai bagian dari pelabelan untuk menentukan kemungkinan output.

    cde-signature-detection-derived-field-4

Output yang diharapkan akan terlihat mirip dengan ini, dengan kehadiran tanda tangan ditampilkan sebagai "Terdeteksi" atau "", dan kolom turunan ditampilkan sebagai teks saat deskripsi label meminta permintaan.

cde-signature-detection-derived-field-5

Ringkasan ekstrak versus turunan

Saat menentukan entity dalam skema pemroses, Anda dapat memilih metode untuk cara pengisian nilainya.

  • Ekstrak: Ini adalah metode default. Metode ini berfungsi saat nilai entitas harus diekstrak langsung dari teks dokumen. Sistem mengidentifikasi teks dan mengisi kolom seperti textAnchor dan pageAnchor untuk menampilkan lokasinya.

  • Turunan: Metode ini digunakan saat nilai entitas perlu disimpulkan dari konten dokumen. Karena nilai tidak ada secara langsung dalam teks, kolom textAnchor dan pageAnchor tidak diisi.

Contoh kasus penggunaan: menemukan kode mata uang

Bayangkan Anda perlu mengidentifikasi kode mata uang (misalnya, USD, CAD, EUR) untuk transaksi dalam dokumen Anda.

  • Kapan harus menggunakan Extract: Jika dokumen secara konsisten berisi simbol atau kode mata uang yang tidak ambigu seperti "USD" atau "€", gunakan metode Extract untuk menemukan dan mengekstrak teks yang tepat tersebut.

  • Kapan menggunakan Derived: Jika dokumen menggunakan simbol ambigu seperti "$" (yang dapat merujuk ke USD, CAD, AUD, dll.) atau tidak memiliki simbol sama sekali, gunakan metode Derived. Model menganalisis konteks dokumen—seperti alamat penagihan atau lokasi perusahaan—untuk menyimpulkan kode mata uang ISO 4217 yang benar.

Praktik terbaik konfigurasi

Untuk mendapatkan hasil terbaik dengan kolom turunan, sebaiknya Anda menulis description yang jelas dan instruksional untuk properti dalam skema Anda selama pelabelan. Hal ini membantu memandu model dalam tugas derivasinya.

Dalam contoh kode mata uang, Anda dapat membuat kolom dengan nama currency_code dan memberikan deskripsi berikut: "Temukan kode mata uang ISO 4217 dari nilai jumlah dalam dokumen, menggunakan sinyal kontekstual yang ada dalam dokumen, seperti simbol mata uang dan alamat."

Batasan

Kolom turunan dibuat berdasarkan per halaman. Artinya, kasus penggunaan yang memerlukan informasi dari beberapa halaman tidak sepenuhnya didukung. Misalnya, jika Anda mengonfigurasi kolom turunan untuk meringkas dokumen, kolom tersebut akan membuat ringkasan terpisah untuk setiap halaman, bukan satu ringkasan yang kohesif untuk seluruh dokumen. Batasan ini berlaku untuk kolom apa pun yang nilainya harus diperoleh menggunakan informasi lintas halaman.

Deteksi tanda tangan di pengekstrak kustom

Pengekstrak kustom Document AI mendukung deteksi tanda tangan di model pengekstrak kustom pretrained-foundation-model-v1.4-2025-02-05 dan pretrained-foundation-model-v1.5-2025-05-05. Anda dapat mengaktifkan fitur ini di UI konsol saat membuat atau mengedit label dalam skema dokumen.

Deteksi tanda tangan adalah fitur yang memungkinkan Anda menentukan apakah tanda tangan ada dalam dokumen Anda. Fitur ini memverifikasi bahwa tanda tangan ada dengan menganalisis isyarat visual, bukan mengekstrak teks.

Cara kerja deteksi tanda tangan

Untuk mengaktifkan fungsi ini, jenis data signature tersedia saat menentukan skema pemroses. Perilaku prosesor bergantung pada apakah tanda tangan terdeteksi dalam dokumen.

Jika tanda tangan ditemukan, ekstraktor akan menampilkan entitas tanda tangan dalam responsnya. Untuk kolom bernama has_signed, objek respons memiliki struktur berikut:

"has_signed": {
  "mention_text": "Detected",
  "confidence": <confidence_score_between 0 to 1>,
  "normalized_value": {
    "text": "Detected",
    "signature_value": true
  }
}

Jika tanda tangan tidak ditemukan, entity tidak akan ditampilkan dalam respons pemroses.

Mengonfigurasi dan menyiapkan persyaratan utama

Untuk menyiapkan deteksi tanda tangan:

  1. Tentukan skema: Dalam skema pemroses, tambahkan entity baru untuk tanda tangan yang ingin Anda deteksi.
  2. Tetapkan jenis data: Pilih Tanda Tangan sebagai jenis data untuk entitas baru ini.
  3. Menetapkan metode ke turunan: Entitas dengan jenis data signature hanya dapat menggunakan metode Derived. Karena model menyimpulkan keberadaan tanda tangan secara visual, model tidak mengekstrak nilai teks. Oleh karena itu, kolom seperti textAnchor dan pageAnchor tidak diisi untuk entity tanda tangan.

Contoh kasus penggunaan

Bayangkan Anda sedang memproses kontrak dan perlu memverifikasi bahwa kontrak tersebut telah ditandatangani. Anda dapat membuat kolom skema bernama is_contract_signed dan menetapkan jenis datanya ke signature. Saat Anda memproses kontrak yang ditandatangani, respons akan menyertakan entitas is_contract_signed, yang mengonfirmasi keberadaan tanda tangan. Jika tidak ada tanda tangan, entitas ini tidak ada dalam respons. Tindakan ini memungkinkan Anda menandai dokumen yang belum ditandatangani dengan cepat untuk ditinjau.

Langkah berikutnya

Pelajari cara melatih ulang pemroses khusus.