Halaman ini diterjemahkan oleh Cloud Translation API.

Normalisasi

Untuk banyak kolom spesifik yang didukung, Document AI juga menampilkan entity.normalizedValue selain kolom yang diekstrak mentah yang diperoleh melalui textAnchor setiap entitas. Opsi ini menormalisasi teks literal. Normalisasi sering kali memecah nilai teks menjadi sub-kolom.

Ini berisi data dalam format standar untuk mengurangi pasca-pemrosesan, dan memungkinkan konversi ke format apa pun yang dipilih. mentionText, yang merepresentasikan apa yang ada di dokumen, tidak pernah diubah oleh normalisasi.

Kolom yang dinormalisasi termasuk dalam salah satu kategori berikut.

Nilai yang dinormalisasi di konsol

Di konsol Google Cloud , kolom yang dinormalisasi diberi anotasi G. Contoh:

Prosesor yang didukung

Berikut adalah prosesor dan kolom yang mendukung pengayaan dan normalisasi entity:

Prosesor Kolom yang dinormalisasi

Parser Laporan Mutasi Bank

Kategori	Model terlatih
Jenis solusi	Pinjaman
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Parser Paspor Amerika Serikat

Kategori	Model terlatih
Jenis solusi	Identitas
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail

Date Of Birth
Expiration Date
Issue Date

Parser Utilitas

Kategori	Model terlatih
Jenis solusi	Pengadaan
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Terbatas
Detail lengkap prosesor	Entri mendetail

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Parser Pemeriksaan Dokumen Identitas

Kategori	Model terlatih
Jenis solusi	Identitas
Fungsi	OCR, Analisis Kualitas
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Parser Slip Gaji

Kategori	Model terlatih
Jenis solusi	Pinjaman
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Parser surat izin mengemudi (SIM) Amerika Serikat

Kategori	Model terlatih
Jenis solusi	Identitas
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail

Date Of Birth
Expiration Date
Issue Date

Parser Pengeluaran

Kategori	Model terlatih
Jenis solusi	Pengadaan
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Parser Invoice

Kategori	Model terlatih
Jenis solusi	Pengadaan
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Pemroses ekstraksi

Ekstraktor kustom mendukung normalisasi semua entitas dengan jenis data umum berikut: dateTime, currency, money, dan number. Google Cloud

Prosesor Jenis data yang dinormalisasi

Pengekstrak Kustom

Kategori	Ekstrak
Jenis solusi	Kustom
Fungsi	OCR, Ekstraksi Entity
Tahap rilis	Ketersediaan umum
Status akses	Publik
Detail lengkap prosesor	Entri mendetail