Deteksi tanda tangan dan kolom turunan
Fitur kolom turunan pratinjau publik memungkinkan pelanggan Document AI mengonfigurasi kolom yang akan diisi melalui inferensi atau pembuatan cerdas berdasarkan konteks dokumen, bukan ekstraksi teks langsung.
Rilis ini juga menambahkan fitur lain untuk mendeteksi keberadaan tanda tangan dalam dokumen. Anda dapat menggunakan jenis entity signature
baru untuk menentukan skema bagi entity tersebut. Entitas tanda tangan berasal dari petunjuk visual dari dokumen.
Kolom turunan di pengekstrak kustom
Ekstraktor kustom mendukung kolom turunan dalam model berikut:
pretrained-foundation-model-v1.4-2025-02-05
sebagai Ketersediaan Umum (GA)pretrained-foundation-model-v1.5-2025-05-05
sebagai Pratinjaupretrained-foundation-model-v1.5-pro-2025-06-20
sebagai Pratinjau
Anda dapat mengaktifkan fitur ini di UI konsol saat membuat atau mengedit label dalam skema dokumen.
Kolom Turunan adalah fitur canggih yang memungkinkan Anda mengekstrak informasi yang tidak ditulis secara eksplisit dalam dokumen. Dengan begitu, Anda dapat mengonfigurasi kolom agar diisi melalui inferensi atau pembuatan cerdas berdasarkan konteks keseluruhan dokumen. Hal ini melampaui ekstraksi teks dasar dan mendukung kasus penggunaan lanjutan, seperti:
- Menyimpulkan negara dari alamat.
- Menghitung jumlah total item dalam tabel.
- Mendeteksi apakah kartu identitas adalah "ID Asli".
Contoh pembuatan skema
Berikut adalah contoh pembuatan skema untuk kolom turunan untuk kasus penggunaan tersebut dan output yang diharapkan, menggunakan surat izin mengemudi AS.
Pilih metode
Derived
saat membuat elemen skema.Tambahkan label deskriptif untuk meningkatkan performa.
Kolom turunan seperti tanda tangan tidak memerlukan penetapan kotak pembatas saat memberi label pada dokumen. Untuk Nilai, pilih Terdeteksi.
Untuk kolom turunan selain tanda tangan, Anda dapat memasukkan Nilai apa pun sebagai bagian dari pelabelan untuk menentukan kemungkinan output.
Output yang diharapkan akan terlihat mirip dengan ini, dengan kehadiran tanda tangan ditampilkan sebagai "Terdeteksi" atau "", dan kolom turunan ditampilkan sebagai teks saat deskripsi label meminta permintaan.
Ringkasan ekstrak versus turunan
Saat menentukan entity dalam skema pemroses, Anda dapat memilih metode untuk cara pengisian nilainya.
Ekstrak: Ini adalah metode default. Metode ini berfungsi saat nilai entitas harus diekstrak langsung dari teks dokumen. Sistem mengidentifikasi teks dan mengisi kolom seperti
textAnchor
danpageAnchor
untuk menampilkan lokasinya.Turunan: Metode ini digunakan saat nilai entitas perlu disimpulkan dari konten dokumen. Karena nilai tidak ada secara langsung dalam teks, kolom
textAnchor
danpageAnchor
tidak diisi.
Contoh kasus penggunaan: menemukan kode mata uang
Bayangkan Anda perlu mengidentifikasi kode mata uang (misalnya, USD, CAD, EUR) untuk transaksi dalam dokumen Anda.
Kapan harus menggunakan
Extract
: Jika dokumen secara konsisten berisi simbol atau kode mata uang yang tidak ambigu seperti "USD" atau "€", gunakan metodeExtract
untuk menemukan dan mengekstrak teks yang tepat tersebut.Kapan menggunakan
Derived
: Jika dokumen menggunakan simbol ambigu seperti "$" (yang dapat merujuk ke USD, CAD, AUD, dll.) atau tidak memiliki simbol sama sekali, gunakan metodeDerived
. Model menganalisis konteks dokumen—seperti alamat penagihan atau lokasi perusahaan—untuk menyimpulkan kode mata uang ISO 4217 yang benar.
Praktik terbaik konfigurasi
Untuk mendapatkan hasil terbaik dengan kolom turunan, sebaiknya Anda menulis description
yang jelas dan instruksional untuk properti dalam skema Anda selama pelabelan. Hal ini membantu memandu model dalam tugas derivasinya.
Dalam contoh kode mata uang, Anda dapat membuat kolom dengan nama
currency_code
dan memberikan deskripsi berikut: "Temukan kode mata uang ISO 4217
dari nilai jumlah dalam dokumen, menggunakan sinyal kontekstual
yang ada dalam dokumen, seperti simbol mata uang dan alamat."
Batasan
Kolom turunan dibuat berdasarkan per halaman. Artinya, kasus penggunaan yang memerlukan informasi dari beberapa halaman tidak sepenuhnya didukung. Misalnya, jika Anda mengonfigurasi kolom turunan untuk meringkas dokumen, kolom tersebut akan membuat ringkasan terpisah untuk setiap halaman, bukan satu ringkasan yang kohesif untuk seluruh dokumen. Batasan ini berlaku untuk kolom apa pun yang nilainya harus diperoleh menggunakan informasi lintas halaman.
Deteksi tanda tangan di pengekstrak kustom
Pengekstrak kustom Document AI mendukung deteksi tanda tangan di model pengekstrak kustom pretrained-foundation-model-v1.4-2025-02-05
dan pretrained-foundation-model-v1.5-2025-05-05
. Anda dapat mengaktifkan fitur ini di UI konsol saat membuat atau mengedit label dalam skema dokumen.
Deteksi tanda tangan adalah fitur yang memungkinkan Anda menentukan apakah tanda tangan ada dalam dokumen Anda. Fitur ini memverifikasi bahwa tanda tangan ada dengan menganalisis isyarat visual, bukan mengekstrak teks.
Cara kerja deteksi tanda tangan
Untuk mengaktifkan fungsi ini, jenis data signature
tersedia saat menentukan skema pemroses. Perilaku prosesor bergantung pada apakah tanda tangan terdeteksi dalam dokumen.
Jika tanda tangan ditemukan, ekstraktor akan menampilkan entitas tanda tangan dalam responsnya.
Untuk kolom bernama has_signed
, objek respons memiliki struktur berikut:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
Jika tanda tangan tidak ditemukan, entity tidak akan ditampilkan dalam respons pemroses.
Mengonfigurasi dan menyiapkan persyaratan utama
Untuk menyiapkan deteksi tanda tangan:
- Tentukan skema: Dalam skema pemroses, tambahkan entity baru untuk tanda tangan yang ingin Anda deteksi.
- Tetapkan jenis data: Pilih Tanda Tangan sebagai jenis data untuk entitas baru ini.
- Menetapkan metode ke turunan: Entitas dengan jenis data
signature
hanya dapat menggunakan metodeDerived
. Karena model menyimpulkan keberadaan tanda tangan secara visual, model tidak mengekstrak nilai teks. Oleh karena itu, kolom sepertitextAnchor
danpageAnchor
tidak diisi untuk entity tanda tangan.
Contoh kasus penggunaan
Bayangkan Anda sedang memproses kontrak dan perlu memverifikasi bahwa kontrak tersebut telah ditandatangani.
Anda dapat membuat kolom skema bernama is_contract_signed
dan menetapkan jenis datanya ke
signature
. Saat Anda memproses kontrak yang ditandatangani, respons akan menyertakan entitas
is_contract_signed
, yang mengonfirmasi keberadaan tanda tangan. Jika tidak ada tanda tangan, entitas ini tidak ada dalam respons. Tindakan ini memungkinkan Anda menandai dokumen yang belum ditandatangani dengan cepat untuk ditinjau.
Langkah berikutnya
Pelajari cara melatih ulang pemroses khusus.