Halaman ini diterjemahkan oleh Cloud Translation API.

Daftar pemroses

Halaman ini berisi informasi mendetail tentang semua pemroses yang ditawarkan oleh Document AI. Anda dapat melihat daftar semua pemroses menurut jenis solusi.

Semua pemroses Document AI mematuhi Persyaratan Pemrosesan dan Keamanan Data.

Lihat dokumentasi Mengelola versi pemroses untuk mengetahui detail selengkapnya. Selain itu, batas pemroses tertentu berlaku selain kuota dan batas produk secara keseluruhan.

Mendigitalkan teks

Enterprise Document OCR (Pengenalan Karakter Optik)

Deskripsi

Mengidentifikasi dan mengekstrak teks dalam berbagai jenis dokumen.

Prosesor ini membantu Anda mengidentifikasi dan mengekstrak teks, termasuk teks tulis tangan, dari dokumen dalam lebih dari 200 bahasa. Prosesor juga menggunakan machine learning untuk melakukan penilaian kualitas dokumen berdasarkan keterbacaan kontennya.

Kategori Mendigitalkan

Fungsi OCR, Analisis Kualitas

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API OCR_PROCESSOR

Bahasa yang didukung

Daftar lengkap bahasa

Nama Bahasa	Tag BCP 47	Skrip
Afrika	`af`	`Latn`
Albania	`sq`	`Latn`
Arab	`ar`	`Arab`
Armenia	`hy`	`Armn`
Belarusia	`be`	`Cyrl`
Bangla	`bn`	`Beng`
Bengali	`bn`	`Beng`
Bulgaria	`bg`	`Cyrl`
Catalan	`ca`	`Latn`
China	`zh`	`Hani`
Kroasia	`hr`	`Latn`
Ceko	`cs`	`Latn`
Denmark	`da`	`Latn`
Belanda	`nl`	`Latn`
Inggris	`en`	`Latn`
Estonia	`et`	`Latn`
Filipina	`fil`	`Latn`
Finlandia	`fi`	`Latn`
Prancis	`fr`	`Latn`
Jerman	`de`	`Latn`
Yunani	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Ibrani	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Hungaria	`hu`	`Latn`
Islan	`is`	`Latn`
Indonesia	`id`	`Latn`
Italia	`it`	`Latn`
Jepang	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Korea	`ko`	`Kore`
Laos	`lo`	`Laoo`
Latvia	`lv`	`Latn`
Lituania	`lt`	`Latn`
Makedonia	`mk`	`Cyrl`
Melayu	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepal	`ne`	`Deva`
Norwegia	`no`	`Latn`
Persia	`fa`	`Arab`
Polandia	`pl`	`Latn`
Portugis (Portugal & Brasil)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumania	`ro`	`Latn`
Rusia	`ru`	`Cyrl`
Serbia	`sr`	`Cyrl`
Slovakia	`sk`	`Latn`
Slovenia	`sl`	`Latn`
Spanyol	`es`	`Latn`
Swedia	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thai	`th`	`Thai`
Turki	`tr`	`Latn`
Ukraina	`uk`	`Cyrl`
Vietnam	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-ocr-v1.2-2022-11-10`	Stabil	Versi model yang dibekukan v1.0: File model, konfigurasi, dan biner snapshot versi yang dibekukan dalam image container hingga 18 bulan.
`pretrained-ocr-v2.0-2023-06-02`	Stabil	Model siap produksi yang dikhususkan untuk kasus penggunaan dokumen. Mencakup akses ke semua add-on OCR.
`pretrained-ocr-v2.1-2024-08-07`	Stabil	Area utama peningkatan untuk v2.1 adalah: pengenalan teks cetak yang lebih baik, deteksi kotak centang yang lebih presisi, dan urutan baca yang lebih akurat.
`pretrained-ocr-v2.1.1-2025-01-31`	Kandidat rilis	v2.1.1 mirip dengan V2.1, dan tersedia di semua wilayah kecuali: `US`, `EU`, dan `asia-southeast1`.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	500
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Informasi selengkapnya Enterprise Document OCR

Mengekstrak entity dari dokumen

Lihat Set data sampel untuk set data berlabel dan tidak berlabel sampel yang akan digunakan untuk pelatihan.

Pengekstrak Kustom

Deskripsi

Ekstrak kolom dari dokumen menggunakan AI generatif atau model kustom; sesuaikan model agar dapat mengekstrak data dari dokumen Anda secara akurat.

Kategori Ekstrak

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API CUSTOM_EXTRACTION_PROCESSOR

Catatan

Jika menggunakan AI generatif untuk ekstraksi, maka:
- Hanya bahasa Inggris yang didukung secara resmi.
- Ketersediaan wilayah ada di US, EU, northamerica-northeast1, dan asia-southeast1.

Bahasa yang didukung

Daftar lengkap bahasa

Nama Bahasa	Tag BCP 47	Skrip
Afrika	`af`	`Latn`
Arab	`ar`	`Arab`
Azerbaijani	`az`	`Latn`
Azerbaijan (Sirilik)	`az-Cyrl`	`Cyrl`
Belarusia	`be`	`Cyrl`
Bulgaria	`bg`	`Cyrl`
Bosnia	`bs`	`Latn`
Catalan	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Ceko	`cs`	`Latn`
Wales	`cy`	`Latn`
Denmark	`da`	`Latn`
Jerman	`de`	`Latn`
Yunani	`el`	`Grek`
Inggris	`en`	`Latn`
Esperanto	`eo`	`Latn`
Spanyol	`es`	`Latn`
Estonia	`et`	`Latn`
Basque	`eu`	`Latn`
Persia	`fa`	`Arab`
Finlandia	`fi`	`Latn`
Filipina	`fil`	`Latn`
Prancis	`fr`	`Latn`
Irlandia	`ga`	`Latn`
Galisia	`gl`	`Latn`
Hindi	`hi`	`Deva`
Kroasia	`hr`	`Latn`
Kreol Haiti	`ht`	`Latn`
Hungaria	`hu`	`Latn`
Indonesia	`id`	`Latn`
Islan	`is`	`Latn`
Italia	`it`	`Latn`
Ibrani	`iw`	`Hebr`
Jepang	`ja`	`Jpan`
Jawa	`jv`	`Latn`
Kazak	`kk`	`Cyrl`
Korean	`ko`	`Kore`
Kyrgyz	`ky`	`Cyrl`
Latin	`la`	`Latn`
Lituania	`lt`	`Latn`
Latvia	`lv`	`Latn`
Makedonia	`mk`	`Cyrl`
Mongolia	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Melayu	`ms`	`Latn`
Malta	`mt`	`Latn`
Nepal	`ne`	`Deva`
Belanda	`nl`	`Latn`
Norwegia	`no`	`Latn`
Polandia	`pl`	`Latn`
Pashto	`ps`	`Arab`
Portugis (Portugal & Brasil)	`pt`	`Latn`
Rumania	`ro`	`Latn`
Rusia	`ru`	`Cyrl`
Rusia (Ortografi Petrine)	`ru-PETR1708`	`Cyrl`
Sanskrit	`sa`	`Deva`
Slovakia	`sk`	`Latn`
Slovenia	`sl`	`Latn`
Albania	`sq`	`Latn`
Serbia	`sr`	`Cyrl`
Swedia	`sv`	`Latn`
Swahili	`sw`	`Latn`
Tagalog	`tl`	`Latn`
Turki	`tr`	`Latn`
Ukraina	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Uzbekistan	`uz`	`Latn`
Uzbekistan (Sirilik)	`uz-Cyrl`	`Cyrl`
Vietnam	`vi`	`Latn`
Yiddish	`yi`	`Hebr`
China aksara sederhana	`zh-Hans`	`Hani`
China tradisional	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-foundation-model-v1.4-2025-02-05`	Stabil	Kandidat siap produksi yang didukung oleh LLM Gemini 2.0 Flash. Juga mencakup fitur OCR tingkat lanjut seperti deteksi kotak centang.
`pretrained-foundation-model-v1.5-2025-05-05`	Stabil	Kandidat siap produksi yang didukung oleh LLM Gemini 2.5 Flash. Direkomendasikan bagi mereka yang ingin bereksperimen dengan model yang lebih baru.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Kandidat Rilis	Model pratinjau yang didukung oleh LLM Gemini 2.5 Pro. Mendukung kuota hingga 30 halaman per menit untuk permintaan proses online. Model ini memiliki kualitas yang lebih baik dibandingkan dengan v1.5, dan mungkin memiliki latensi yang lebih tinggi.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Jenis data yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi, dan Buat set data.

Daftar lengkap jenis data yang dinormalisasi

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Informasi selengkapnya Pengekstrak Kustom

Form Parser

Deskripsi

Mengekstrak pasangan nilai kunci umum (entity dan kotak centang), tabel, dan entity generik dari dokumen selain teks OCR.

Pemroses ini menerapkan teknologi machine learning canggih untuk mengekstrak pasangan nilai kunci, kotak centang, dan tabel dari dokumen dalam lebih dari 200 bahasa. Prosesor ini juga memanfaatkan model deep learning untuk mengekstrak 11 entity generik yang umum dalam berbagai jenis dokumen.

Kategori Ekstrak

Fungsi OCR, Penguraian Formulir, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API FORM_PARSER_PROCESSOR

Bahasa yang didukung

Daftar lengkap bahasa

Nama Bahasa	Tag BCP 47	Skrip
Afrika	`af`	`Latn`
Albania	`sq`	`Latn`
Arab	`ar`	`Arab`
Belarusia	`be`	`Cyrl`
Catalan	`ca`	`Latn`
China	`zh`	`Hani`
Kroasia	`hr`	`Latn`
Ceko	`cs`	`Latn`
Denmark	`da`	`Latn`
Belanda	`nl`	`Latn`
Inggris	`en`	`Latn`
Estonia	`et`	`Latn`
Filipina	`fil`	`Latn`
Finlandia	`fi`	`Latn`
Prancis	`fr`	`Latn`
Jerman	`de`	`Latn`
Ibrani	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Hungaria	`hu`	`Latn`
Islan	`is`	`Latn`
Indonesia	`id`	`Latn`
Italia	`it`	`Latn`
Jepang	`ja`	`Jpan`
Korean	`ko`	`Kore`
Latvia	`lv`	`Latn`
Lituania	`lt`	`Latn`
Makedonia	`mk`	`Cyrl`
Melayu	`ms`	`Latn`
Marathi	`mr`	`Deva`
Nepal	`ne`	`Deva`
Norwegia	`no`	`Latn`
Persia	`fa`	`Arab`
Polandia	`pl`	`Latn`
Portugis (Portugal & Brasil)	`pt`	`Latn`
Rumania	`ro`	`Latn`
Rusia	`ru`	`Cyrl`
Serbia	`sr`	`Cyrl`
Slovakia	`sk`	`Latn`
Slovenia	`sl`	`Latn`
Spanyol	`es`	`Latn`
Swedia	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Turki	`tr`	`Latn`
Ukraina	`uk`	`Cyrl`
Vietnam	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versi prosesor

ID versi	Saluran Rilis	Kolom tambahan terdeteksi	Deskripsi
`pretrained-form-parser-v1.0-2020-09-23`	Stabil	Tidak ada	Versi lama. Untuk kualitas terbaik dan set fitur lengkap, gunakan Form Parser v2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Stabil	Tampilkan kolom `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Versi yang direkomendasikan. Mendukung entitas generik dan menyertakan model tabel, KVP, dan kotak centang yang ditingkatkan, serta lebih dari 200 bahasa.
`pretrained-form-parser-v2.1-2023-06-26`	Kandidat Rilis	Tidak ada	Versi Pratinjau Publik. Model yang sama dengan v2.0 dengan ekstraksi teks native dari file PDF digital yang diaktifkan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	100
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Informasi selengkapnya Parser Formulir

Parser Tata Letak

Deskripsi

Mengekstrak elemen konten dokumen (teks, tabel, dan daftar) serta membuat potongan kontekstual.

Layout Parser mengekstrak elemen konten dokumen seperti teks, tabel, dan daftar, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam AI generatif dan aplikasi penemuan.

Kategori Ekstrak

Fungsi Penguraian Tata Letak, Pemotongan Dokumen

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API LAYOUT_PARSER_PROCESSOR

Catatan

Parser ini mendukung file PDF, HTML, DOCX, PPTX, dan XLSX/XLSM.

Bahasa yang didukung

Daftar lengkap bahasa

Nama Bahasa	Tag BCP 47	Skrip
Afrika	`af`	`Latn`
Albania	`sq`	`Latn`
Arab	`ar`	`Arab`
Armenia	`hy`	`Armn`
Belarusia	`be`	`Cyrl`
Bangla	`bn`	`Beng`
Bengali	`bn`	`Beng`
Bulgaria	`bg`	`Cyrl`
Catalan	`ca`	`Latn`
China	`zh`	`Hani`
Kroasia	`hr`	`Latn`
Ceko	`cs`	`Latn`
Denmark	`da`	`Latn`
Belanda	`nl`	`Latn`
Inggris	`en`	`Latn`
Estonia	`et`	`Latn`
Filipina	`fil`	`Latn`
Finlandia	`fi`	`Latn`
Prancis	`fr`	`Latn`
Jerman	`de`	`Latn`
Yunani	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Ibrani	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Hungaria	`hu`	`Latn`
Islan	`is`	`Latn`
Indonesia	`id`	`Latn`
Italia	`it`	`Latn`
Jepang	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Korea	`ko`	`Kore`
Laos	`lo`	`Laoo`
Latvia	`lv`	`Latn`
Lituania	`lt`	`Latn`
Makedonia	`mk`	`Cyrl`
Melayu	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepal	`ne`	`Deva`
Norwegia	`no`	`Latn`
Persia	`fa`	`Arab`
Polandia	`pl`	`Latn`
Portugis (Portugal & Brasil)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumania	`ro`	`Latn`
Rusia	`ru`	`Cyrl`
Serbia	`sr`	`Cyrl`
Slovakia	`sk`	`Latn`
Slovenia	`sl`	`Latn`
Spanyol	`es`	`Latn`
Swedia	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thai	`th`	`Thai`
Turki	`tr`	`Latn`
Ukraina	`uk`	`Cyrl`
Vietnam	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-layout-parser-v1.0-2024-06-03`	Stabil	Versi yang direkomendasikan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	500
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

eu
us

Informasi selengkapnya Layout Parser

Menjelajahi prosesor terlatih

Parser Laporan Mutasi Bank

Deskripsi

Mengekstrak dari laporan mutasi bank, termasuk nama, rekening, transaksi, dll.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API BANK_STATEMENT_PROCESSOR

Catatan

Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-bankstatement-v1.0-2021-08-08`	Stabil
`pretrained-bankstatement-v1.1-2021-08-13`	Stabil
`pretrained-bankstatement-v2.0-2021-12-10`	Stabil
`pretrained-bankstatement-v3.0-2022-05-16`	Stabil	Versi ini mengasumsikan bahwa file input berisi satu laporan bank. Tidak seperti versi default, versi ini tidak memeriksa file input untuk laporan mutasi bank dan tidak akan menampilkan error jika tidak ada laporan mutasi bank yang ditemukan.
`pretrained-bankstatement-v4.0-2023-07-31`	Kandidat Rilis
`pretrained-bankstatement-v5.0-2023-12-06`	Kandidat Rilis

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	30
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya

bank_address
bank_name

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Petunjuk Pelabelan Buka di jendela baru.

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

eu
us

Parser W2

Deskripsi

Ekstrak dari Formulir W2, termasuk karyawan, perusahaan, upah, dll.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API FORM_W2_PROCESSOR

Catatan

Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Formulir/versi yang didukung

2020 (versi standar dan yang disesuaikan)
2019 (versi standar dan yang disesuaikan)
2018 (versi standar dan yang disesuaikan)

Versi prosesor

ID versi	Saluran Rilis	Kolom tambahan terdeteksi	Deskripsi
`pretrained-w2-v1.0-2020-10-01`	Stabil	Tidak ada
`pretrained-w2-v1.1-2022-01-27`	Stabil	Tidak ada
`pretrained-w2-v1.2-2022-01-28`	Stabil	Tampilkan kolom `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Peningkatan kualitas dan dukungan untuk kolom baru; tidak menyertakan pemisah.
`pretrained-w2-v2.0-2022-03-30`	Kandidat Rilis	Tampilkan kolom `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Peningkatan kualitas dan dukungan untuk kolom 12 dan prediksi `EmployeeName`, `EmployeeAddress`, dan `EmployerNameAndAddress` yang lebih akurat, yang semuanya tidak lagi menjadi bagian dari output dan digantikan dengan kolom tambahan.
`pretrained-w2-v2.1-2022-06-08`	Stabil	Tampilkan kolom `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Mirip dengan versi `pretrained-w2-v2.0-2022-03-30` dengan peningkatan kualitas lebih lanjut dan memperkenalkan satu entity lagi, yaitu `EmployeeName_Suffix`.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	15
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	15

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya

EmployerNameAndAddress
EIN

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

eu
us

Parser Paspor Amerika Serikat

Deskripsi

Ekstrak kolom seperti nama, ID dokumen, tanggal lahir, dll.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API US_PASSPORT_PROCESSOR

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-us-passport-v1.0-2021-06-14`	Stabil

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	2
Halaman maksimum (permintaan batch/offline/asinkron):	2
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	2

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

Date Of Birth
Expiration Date
Issue Date

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

eu
us

Parser Utilitas

Deskripsi

Mengekstrak teks dan nilai dari tagihan utilitas seperti nama penyedia dan jumlah yang dibayarkan sebelumnya.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Terbatas ^[*]

Ketik API UTILITY_PROCESSOR

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-utility-v1.1-2021-04-09`	Stabil
`pretrained-utility-v1.2-2022-12-15`	Kandidat Rilis

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	10
Halaman maksimum (permintaan batch/offline/asinkron):	200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Petunjuk Pelabelan Buka di jendela baru.

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

eu
us

Parser Pemeriksaan Dokumen Identitas

Deskripsi

Memprediksi validitas dokumen identitas menggunakan beberapa sinyal.

Pemroses Pemeriksaan Dokumen Identitas dirancang untuk membantu memprediksi validitas dokumen identitas dengan empat sinyal yang berbeda.

Saat ini, pemroses menampilkan informasi dari sinyal berikut:

Deteksi fraud_signals_is_identity_document: Memprediksi apakah gambar berisi dokumen identitas yang diakui.
Deteksi fraud_signals_suspicious_words: Memprediksi apakah ada kata-kata yang tidak umum pada ID.
Deteksi fraud_signals_image_manipulation: Memprediksi apakah gambar telah diubah atau dimanipulasi dengan alat pengeditan gambar.
fraud_signals_online_duplicate deteksi: Memprediksi apakah gambar dapat ditemukan secara online (khusus Amerika Serikat).

Kategori Model terlatih

Fungsi OCR, Analisis Kualitas

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API ID_PROOFING_PROCESSOR

Catatan

Fitur Deteksi Duplikat Online saat ini diproses di pusat data AS. Dukungan regional dan multi-regional tidak tersedia untuk fitur ini di luar Amerika Serikat.
Prosesor ini didukung oleh algoritma yang diupdate lebih sering daripada rilis versi prosesor baru. Oleh karena itu, prosesor mungkin memberikan output yang berbeda dari waktu ke waktu meskipun menggunakan versi prosesor yang sama. Misalnya, sistem Deteksi Duplikat Online memantau gambar yang ada di web. Perilaku sistem kemudian dapat berubah lebih cepat daripada yang dapat dilacak dalam versi prosesor.
Lihat catatan tentang Responsible AI^[†] dan Peninjauan oleh manusia.^[‡]

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Formulir/versi yang didukung

Dukungan untuk paspor, kartu paspor, dan surat izin mengemudi Amerika Serikat.

Versi prosesor

ID versi	Saluran Rilis	Kolom tambahan terdeteksi	Deskripsi
`pretrained-id-proofing-v1.0-2022-10-03`	Stabil	Tidak ada
`pretrained-id-proofing-v1.1-2023-05-18`	Kandidat Rilis	Tampilkan kolom `fraud_signals_photocopy_detection`	Sinyal deteksi fotokopi tambahan
`pretrained-id-proofing-v1.2-2023-10-04`	Kandidat Rilis	Tampilkan kolom `fraud_signals_photocopy_detection`

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	2
Halaman maksimum (permintaan batch/offline/asinkron):	2
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	2

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

eu
us

Parser Slip Gaji

Deskripsi

Mengekstrak dari slip gaji, termasuk nama, bisnis, jumlah, dll.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API PAYSTUB_PROCESSOR

Catatan

Jika dokumen input multi-halaman berisi lebih dari satu slip gaji yang valid, pemroses hanya akan mengekstrak entitas dari slip gaji valid pertama. Jika tidak ada slip gaji yang ditemukan dalam file input, pemroses akan menampilkan pesan error.

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Kolom tambahan terdeteksi	Deskripsi
`pretrained-paystub-v1.0-2021-03-19`	Stabil	Tidak ada
`pretrained-paystub-v1.1-2021-08-13`	Stabil	Tampilkan kolom `net_pay` `net_pay_ytd` `employee_account_number`	Peningkatan kualitas dan dukungan kolom baru;
`pretrained-paystub-v1.2-2021-12-10`	Stabil	Tidak ada
`pretrained-paystub-v2.0-2022-05-17`	Kandidat Rilis	Tampilkan kolom `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	Versi ini mengasumsikan bahwa file input berisi satu slip gaji. Tidak seperti versi default, versi ini tidak memeriksa file input untuk slip gaji dan tidak akan menampilkan error jika tidak ada slip gaji yang ditemukan. Peningkatan kualitas, dukungan kolom baru, dan skema baru. Bonus, Komisi, Liburan, Lembur, Gaji Reguler, dan Cuti kini menjadi bagian dari earning_item/earning_this_period, dan versi tahun berjalan ada di earning_item/earning_ytd. Setoran Langsung dan Nomor Rekening Karyawan kini berada di bawah direct_deposit_item. Batas halaman asinkron adalah 10.
`pretrained-paystub-v2.0-2022-07-22`	Stabil	Tidak ada	Peningkatan kualitas dan peningkatan pelatihan ulang.
`pretrained-paystub-v3.0-2023-12-06`	Kandidat Rilis	Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	50
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya

employer_address
employer_name

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Petunjuk Pelabelan Buka di jendela baru.

Wilayah yang didukung

eu
us

Parser surat izin mengemudi (SIM) Amerika Serikat

Deskripsi

Ekstrak kolom seperti nama, ID dokumen, tanggal lahir, dll.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API US_DRIVER_LICENSE_PROCESSOR

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Formulir/versi yang didukung

Mendukung seluruh 50 Negara Bagian dan D.C.

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-us-driver-license-v1.0-2021-06-14`	Stabil

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	2
Halaman maksimum (permintaan batch/offline/asinkron):	2
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	2

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

Date Of Birth
Expiration Date
Issue Date

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

eu
us

Parser Pengeluaran

Deskripsi

Mengekstrak teks dan nilai dari dokumen pengeluaran seperti tanggal pengeluaran, nama penyedia, jumlah total, dan mata uang.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API EXPENSE_PROCESSOR

Bahasa yang didukung

Daftar lengkap bahasa

Nama Bahasa	Tag BCP 47	Skrip
Jerman	`de`	`Latn`
Inggris	`en`	`Latn`
Spanyol	`es`	`Latn`
Prancis	`fr`	`Latn`
Jepang	`ja`	`Jpan`
Belanda	`nl`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Kolom tambahan terdeteksi	Bahasa tambahan yang didukung	Deskripsi
`pretrained-expense-v1.1-2021-04-09`	Stabil	Tidak ada	Tidak ada	Diluncurkan pada April 2021.
`pretrained-expense-v1.3.2-2024-09-11`	Kandidat Rilis	Tampilkan kolom `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: Jepang	Upgrade ke v1.3 dengan model visi pokok yang ditingkatkan.
`pretrained-expense-v1.4-2022-11-18`	Kandidat Rilis	Tampilkan kolom `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Jepang `it`: Italia `pt`: Portugis (Portugal & Brasil)	Peningkatan performa dan dukungan untuk pelatihan ulang. Batas halaman maksimum (permintaan online/sinkron) telah ditingkatkan menjadi 15. Catatan: Akan dihentikan di Amerika Serikat (AS) dan Uni Eropa (UE) mulai 30 April 2025.
`pretrained-expense-v1.4.2-2024-09-12`	Kandidat Rilis	Tampilkan kolom `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Jepang `it`: Italia `pt`: Portugis (Portugal & Brasil)	Upgrade ke v1.4 dengan model visi pokok yang ditingkatkan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	10
Halaman maksimum (permintaan batch/offline/asinkron):	10
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	10

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya

supplier_address
supplier_name
supplier_phone

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Petunjuk Pelabelan Buka di jendela baru.

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Parser Invoice

Deskripsi

Ekstrak teks dan nilai dari invoice seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo.

Parser invoice mengekstrak kolom header dan item baris, seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo, dan jumlah item baris.

Kategori Model terlatih

Fungsi OCR, Ekstraksi Entity

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API INVOICE_PROCESSOR

Bahasa yang didukung

Daftar lengkap bahasa

Nama Bahasa	Tag BCP 47	Skrip
Jerman	`de`	`Latn`
Inggris	`en`	`Latn`
Spanyol	`es`	`Latn`
Estonia	`et`	`Latn`
Prancis	`fr`	`Latn`
Italia	`it`	`Latn`
Latvia	`lv`	`Latn`
Lituania	`lt`	`Latn`
Belanda	`nl`	`Latn`
Portugis (Portugal & Brasil)	`pt`	`Latn`
Rumania	`ro`	`Latn`
Swedia	`sv`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Bahasa tambahan yang didukung	Deskripsi
`pretrained-invoice-v1.1-2021-04-09`	Stabil	Tidak ada
`pretrained-invoice-v1.2-2022-02-18`	Stabil	Tidak ada	Penghentian penggunaan akan segera dilakukan.
`pretrained-invoice-v1.3-2022-07-15`	Stabil	`it`: Italia `pt`: Portugis (Portugal & Brasil) `ro`: Rumania `sv`: Swedia `et`: Estonia `lv`: Latvia `lt`: Lituania	Versi pemroses yang dapat dilatih ulang. Jumlah maksimum halaman (permintaan online/sinkron) telah ditingkatkan menjadi 15.
`pretrained-invoice-v1.4-2022-10-21`	Kandidat Rilis	Tidak ada	Versi pemroses yang dapat dilatih ulang. Jumlah maksimum halaman (permintaan online/sinkron) telah ditingkatkan menjadi 15.
`pretrained-invoice-v1.5-2023-09-15`	Kandidat Rilis	Tidak ada
`pretrained-invoice-v2.0-2023-12-06`	Kandidat Rilis	Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya

supplier_address
supplier_name
supplier_phone

Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Petunjuk Pelabelan Buka di jendela baru.

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Mengklasifikasikan dokumen

Pengklasifikasi Kustom

Deskripsi

Latih model untuk mengklasifikasikan jenis dokumen dari serangkaian kelas.

Kategori Klasifikasikan

Fungsi OCR, Klasifikasi

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API CUSTOM_CLASSIFICATION_PROCESSOR

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-foundation-model-v1.4-2025-05-16`	Kandidat Rilis	Kandidat rilis yang didukung oleh LLM Gemini 2.0 Flash. Juga mencakup fitur OCR lanjutan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Informasi selengkapnya Membuat pemroses klasifikasi kustom

Pemisah Kustom

Deskripsi

Latih model untuk memisahkan file yang berisi beberapa dokumen menjadi dokumen individual yang diklasifikasikan.

Kategori Klasifikasikan

Fungsi OCR, Klasifikasi, Pemisahan

Tahap rilis Ketersediaan umum

Status akses Publik

Ketik API CUSTOM_SPLITTING_PROCESSOR

Catatan

i18n hanya dapat didukung melalui opsi pelatihan kustom.

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	1000
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Informasi selengkapnya Membuat pemroses pemisah kustom

Meringkas dokumen

Peringkas

Deskripsi

Dapatkan ringkasan abstrak dan poin-poin penting untuk dokumen pendek dan panjang.

Kategori sudah dilatih

Fungsi Ringkasan

Tahap rilis Pratinjau

Status akses Publik

Ketik API SUMMARY_PROCESSOR

Bahasa yang didukung

Nama Bahasa	Tag BCP 47	Skrip	Tulisan tangan didukung
Inggris	`en`	`Latn`

Versi prosesor

ID versi	Saluran Rilis	Deskripsi
`pretrained-foundation-model-v1.0-2023-08-22`	Stabil	Model dasar Google

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas

Halaman maksimum (permintaan online/sinkron):	15
Halaman maksimum (permintaan batch/offline/asinkron):	250
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar):	30

Catatan: Untuk memperpanjang batas halaman maksimum untuk permintaan online dan sinkron hingga 30, pastikan untuk mengaktifkan imageless_mode di ProcessRequest.

Uptraining

Contoh File Input Buka di jendela baru.

Contoh Output Buka di jendela baru.

Wilayah yang didukung

us

Informasi selengkapnya Perangkum kustom

Catatan kaki

^[*] Pemroses ini hanya tersedia untuk pelanggan dengan akses terbatas.

Untuk meminta akses API, isi dan kirimkan formulir permintaan pelanggan akses terbatas Document AI. Formulir tersebut meminta informasi tentang Anda, perusahaan Anda, dan kasus penggunaan Anda. Perhatikan bahwa Project ID Google Cloud diperlukan untuk mendapatkan akses. Untuk membuat project Google Cloud baru atau mengidentifikasi Project ID dari project Anda yang sudah ada, lihat petunjuk berikut.

Setelah Anda mengirimkan formulir, tim Document AI akan meninjau permintaan Anda untuk memastikan Anda memenuhi kriteria akses. Jika disetujui, Anda akan menerima email berisi petunjuk tentang cara mengakses dan menggunakan fitur ini.

^[†] Pembuktian Dokumen Identitas berfungsi untuk mengekstrak dan mengevaluasi informasi dari dokumen identitas yang berkontribusi untuk mengidentifikasi apakah gambar input merepresentasikan tanda pengenal yang asli.

Di Google Cloud, kami memprioritaskan untuk membantu pelanggan mengembangkan dan mengimplementasikan solusi AI dengan aman, dan Pembuktian Identitas telah dikembangkan sesuai dengan Prinsip AI Google.

Berdasarkan Prinsip AI Google dan desain produk saat ini, sebaiknya Anda berhati-hati dan mengevaluasi dengan cermat potensi manfaat dan risiko penggunaan Verifikasi Dokumen Identitas untuk hal-hal berikut:

Pengambilan keputusan tanpa campur tangan manusia untuk prediksi yang dapat memengaruhi hak asasi manusia.
Di domain sensitif, termasuk, tetapi tidak terbatas pada, pekerjaan, akses ke layanan publik, kesehatan, dan konteks yang sangat penting untuk keselamatan.

^[‡] Selalu gunakan Pembuktian Identitas sebagai bagian dari proses dan alur kerja deteksi identitas yang lebih luas. Anda harus memiliki peninjau manual dalam alur kerja untuk memverifikasi apakah sinyal yang diprediksi akurat atau tidak. Prosesor Pembuktian Identitas tidak dimaksudkan untuk menggantikan peninjauan ID oleh manusia dalam alur kerja, melainkan untuk membantu peninjau manusia dalam memvalidasi dokumen ID. Prosesor Pembuktian Identitas tidak boleh digunakan sebagai alat keputusan otomatis untuk menentukan apakah tanda pengenal valid atau tidak. Dengan peninjauan manual, pelanggan dapat mencapai akurasi pemrosesan dokumen yang lebih tinggi dan membantu bisnis mengevaluasi prediksi menggunakan alat yang dibuat khusus untuk mendukung peninjauan tersebut.

Pastikan Anda meninjau peraturan di wilayah tempat Anda menerapkan teknologi ini, dan meneliti panduan industri yang ada untuk mempelajari pedoman kebijakan dan masalah keadilan umum. Baca tentang keadilan dalam machine learning, termasuk cara mengurangi bias dalam set data pelatihan, mengevaluasi model kustom Anda untuk mendeteksi kesenjangan performa, dan pertimbangan lainnya saat Anda menggunakan model kustom Anda.

Kami mendorong pelanggan untuk selalu mempertimbangkan praktik terbaik keadilan, kemampuan interpretasi, serta privasi dan keamanan saat menerapkan fitur Verifikasi Identitas. Untuk mempelajari lebih lanjut cara menerapkan AI yang bertanggung jawab, baca rekomendasi Google untuk praktik Responsible AI.

Lihat postingan blog Mengotomatiskan pemrosesan dokumen identitas dengan Document AI] untuk mengetahui informasi selengkapnya tentang kasus penggunaan dan repositori kode aplikasi contoh.

Berikutnya

File yang didukung

Daftar pemroses

Mendigitalkan teks

Enterprise Document OCR (Pengenalan Karakter Optik)

Daftar lengkap bahasa

Mengekstrak entity dari dokumen

Pengekstrak Kustom

Daftar lengkap bahasa

Daftar lengkap jenis data yang dinormalisasi

Form Parser

Daftar lengkap bahasa

Tampilkan kolom

Parser Tata Letak

Daftar lengkap bahasa

Menjelajahi prosesor terlatih

Parser Laporan Mutasi Bank

Daftar lengkap kolom

Daftar lengkap kolom yang diperkaya

Daftar lengkap kolom yang dinormalisasi

Parser W2

Tampilkan kolom

Tampilkan kolom

Tampilkan kolom

Daftar lengkap kolom

Daftar lengkap kolom yang diperkaya

Parser Paspor Amerika Serikat

Daftar lengkap kolom

Daftar lengkap kolom yang dinormalisasi

Parser Utilitas

Daftar lengkap kolom

Daftar lengkap kolom yang dinormalisasi

Parser Pemeriksaan Dokumen Identitas

Tampilkan kolom

Tampilkan kolom

Daftar lengkap kolom

Daftar lengkap kolom yang dinormalisasi

Parser Slip Gaji

Tampilkan kolom

Tampilkan kolom

Daftar lengkap kolom

Daftar lengkap kolom yang diperkaya

Daftar lengkap kolom yang dinormalisasi

Parser surat izin mengemudi (SIM) Amerika Serikat

Daftar lengkap kolom

Daftar lengkap kolom yang dinormalisasi

Parser Pengeluaran

Daftar lengkap bahasa

Tampilkan kolom

Tampilkan kolom

Tampilkan kolom

Daftar lengkap kolom

Daftar lengkap kolom yang diperkaya

Daftar lengkap kolom yang dinormalisasi

Parser Invoice

Daftar lengkap bahasa

Daftar lengkap kolom

Daftar lengkap kolom yang diperkaya

Daftar lengkap kolom yang dinormalisasi

Mengklasifikasikan dokumen

Pengklasifikasi Kustom

Pemisah Kustom

Meringkas dokumen

Peringkas

Catatan kaki