Normalisasi

Untuk banyak kolom spesifik yang didukung, Document AI juga menampilkan entity.normalizedValue selain kolom yang diekstrak mentah yang diperoleh melalui textAnchor setiap entitas. Opsi ini menormalisasi teks literal. Normalisasi sering kali memecah nilai teks menjadi sub-kolom.

Ini berisi data dalam format standar untuk mengurangi pasca-pemrosesan, dan memungkinkan konversi ke format apa pun yang dipilih. mentionText, yang merepresentasikan apa yang ada di dokumen, tidak pernah diubah oleh normalisasi.

Kolom yang dinormalisasi termasuk dalam salah satu kategori berikut.

Nilai yang dinormalisasi di konsol

Di konsol Google Cloud , kolom yang dinormalisasi diberi anotasi G. Contoh:

pengayaan
Contoh kolom yang dinormalisasi yang ditampilkan di aplikasi web.

Prosesor yang didukung

Berikut adalah prosesor dan kolom yang mendukung pengayaan dan normalisasi entity:

Prosesor Kolom yang dinormalisasi

Parser Laporan Mutasi Bank

Kategori Model terlatih
Jenis solusi Pinjaman
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date

Parser Paspor Amerika Serikat

Kategori Model terlatih
Jenis solusi Identitas
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • Date Of Birth
  • Expiration Date
  • Issue Date

Parser Utilitas

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Terbatas
Detail lengkap prosesor Entri mendetail
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount

Parser Pemeriksaan Dokumen Identitas

Kategori Model terlatih
Jenis solusi Identitas
Fungsi OCR, Analisis Kualitas
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words

Parser Slip Gaji

Kategori Model terlatih
Jenis solusi Pinjaman
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd

Parser surat izin mengemudi (SIM) Amerika Serikat

Kategori Model terlatih
Jenis solusi Identitas
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • Date Of Birth
  • Expiration Date
  • Issue Date

Parser Pengeluaran

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount

Parser Invoice

Kategori Model terlatih
Jenis solusi Pengadaan
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate

Pemroses ekstraksi

Ekstraktor kustom mendukung normalisasi semua entitas dengan jenis data umum berikut: dateTime, currency, money, dan number. Google Cloud

Prosesor Jenis data yang dinormalisasi

Pengekstrak Kustom

Kategori Ekstrak
Jenis solusi Kustom
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Detail lengkap prosesor Entri mendetail
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER