Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Daftar pemroses
Halaman ini berisi informasi mendetail tentang semua pemroses yang ditawarkan oleh Document AI. Anda dapat melihat daftar semua pemroses menurut jenis solusi.
Lihat dokumentasi Mengelola versi pemroses untuk mengetahui detail selengkapnya. Selain kuota dan batas produk secara keseluruhan, batas prosesor tertentu juga berlaku.
Mendigitalkan teks
Enterprise Document OCR (Pengenalan Karakter Optik)
Deskripsi
Mengidentifikasi dan mengekstrak teks dalam berbagai jenis dokumen.
Prosesor ini memungkinkan Anda mengidentifikasi dan mengekstrak teks, termasuk teks tulis tangan, dari dokumen dalam lebih dari 200 bahasa. Prosesor juga menggunakan machine learning untuk melakukan penilaian kualitas dokumen berdasarkan keterbacaan kontennya.
Versi model yang dibekukan v1.0: File model, konfigurasi, dan biner snapshot versi yang dibekukan dalam image container hingga 18 bulan.
pretrained-ocr-v2.0-2023-06-02
Stabil
Model siap produksi yang dikhususkan untuk kasus penggunaan dokumen. Mencakup akses ke semua add-on OCR.
pretrained-ocr-v2.1-2024-08-07
Stabil
Area utama peningkatan untuk v2.1 adalah: pengenalan teks cetak yang lebih baik, deteksi kotak centang yang lebih presisi, dan urutan baca yang lebih akurat.
pretrained-ocr-v2.1.1-2025-01-31
Kandidat rilis
v2.1.1 mirip dengan V2.1, dan tersedia di semua wilayah kecuali: US, EU, dan asia-southeast1.
Mengekstrak pasangan nilai kunci umum (entity dan kotak centang), tabel, dan entity generik dari dokumen selain teks OCR.
Pemroses ini menerapkan teknologi machine learning canggih untuk mengekstrak pasangan nilai kunci, kotak centang, dan tabel dari dokumen dalam lebih dari 200 bahasa. Prosesor ini juga memanfaatkan model deep learning untuk mengekstrak 11 entity generik yang umum dalam berbagai jenis dokumen.
Versi lama. Untuk kualitas terbaik dan set fitur lengkap, gunakan Form Parser v2.0.
pretrained-form-parser-v2.0-2022-11-10
Stabil
Tampilkan kolom
email
phone
url
date_time
address
person
organization
quantity
price
id
page_number
Versi yang direkomendasikan. Mendukung entitas generik dan menyertakan model tabel, KVP, dan kotak centang yang ditingkatkan, serta lebih dari 200 bahasa.
pretrained-form-parser-v2.1-2023-06-26
Kandidat Rilis
Tidak ada
Versi Pratinjau Publik. Model yang sama dengan v2.0 dengan ekstraksi teks native dari file PDF digital yang diaktifkan.
Mengekstrak elemen konten dokumen (teks, tabel, dan daftar) serta membuat potongan kontekstual.
Layout Parser mengekstrak elemen konten dokumen seperti teks, tabel, dan daftar, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam AI generatif dan aplikasi penemuan.
Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Versi prosesor
ID versi
Saluran Rilis
Deskripsi
pretrained-bankstatement-v1.0-2021-08-08
Stabil
pretrained-bankstatement-v1.1-2021-08-13
Stabil
pretrained-bankstatement-v2.0-2021-12-10
Stabil
pretrained-bankstatement-v3.0-2022-05-16
Stabil
Versi ini mengasumsikan bahwa file input berisi satu laporan bank. Tidak seperti versi default, versi ini tidak memeriksa file input untuk laporan mutasi bank dan tidak akan menampilkan error jika tidak ada laporan mutasi bank yang ditemukan.
Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Formulir/versi yang didukung
2020 (versi standar dan yang disesuaikan)
2019 (versi standar dan yang disesuaikan)
2018 (versi standar dan yang disesuaikan)
Versi prosesor
ID versi
Saluran Rilis
Kolom tambahan terdeteksi
Deskripsi
pretrained-w2-v1.0-2020-10-01
Stabil
Tidak ada
pretrained-w2-v1.1-2022-01-27
Stabil
Tidak ada
pretrained-w2-v1.2-2022-01-28
Stabil
Tampilkan kolom
AllocatedTips
ControlNumber
DependentCareBenefits
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
EmployerStateIdNumber_Line1
FederalIncomeTaxWithheld
FormYear
LocalIncomeTax_Line1
LocalityName_Line1
LocalWagesTipsEtc_Line1
MedicareTaxWithheld
MedicareWagesAndTips
NonqualifiedPlans
SocialSecurityTaxWithheld
SocialSecurityTips
SocialSecurityWages
SSN
State_Line1
StateIncomeTax_Line1
StateWagesTipsEtc_Line1
WagesTipsOtherCompensation
Peningkatan kualitas dan dukungan untuk kolom baru; tidak menyertakan pemisah.
Peningkatan kualitas dan dukungan untuk kolom 12 kotak serta prediksi EmployeeName, EmployeeAddress, dan EmployerNameAndAddress yang lebih akurat, yang semuanya tidak lagi menjadi bagian dari output dan digantikan dengan kolom tambahan.
Mirip dengan versi pretrained-w2-v2.0-2022-03-30 dengan peningkatan kualitas lebih lanjut dan memperkenalkan satu entity lagi, yaitu EmployeeName_Suffix.
Fitur Deteksi Duplikat Online saat ini diproses di pusat data AS. Dukungan regional dan multi-regional tidak tersedia untuk fitur ini di luar Amerika Serikat.
Prosesor ini didukung oleh algoritma yang diupdate lebih sering daripada rilis versi prosesor baru. Oleh karena itu, prosesor mungkin memberikan output yang berbeda dari waktu ke waktu meskipun menggunakan versi prosesor yang sama. Misalnya, sistem Deteksi Duplikat Online memantau gambar yang ada di web. Perilaku sistem kemudian dapat berubah lebih cepat daripada yang dapat dilacak dalam versi prosesor.
Lihat catatan tentang Responsible AI[†] dan Peninjauan oleh manusia.[‡]
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Formulir/versi yang didukung
Dukungan untuk paspor, kartu paspor, dan surat izin mengemudi Amerika Serikat.
Jika dokumen input multi-halaman berisi lebih dari satu slip gaji yang valid, pemroses hanya akan mengekstrak entitas dari slip gaji valid pertama. Jika tidak ada slip gaji yang ditemukan dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Versi prosesor
ID versi
Saluran Rilis
Kolom tambahan terdeteksi
Deskripsi
pretrained-paystub-v1.0-2021-03-19
Stabil
Tidak ada
pretrained-paystub-v1.1-2021-08-13
Stabil
Tampilkan kolom
net_pay
net_pay_ytd
employee_account_number
Peningkatan kualitas dan dukungan kolom baru;
pretrained-paystub-v1.2-2021-12-10
Stabil
Tidak ada
pretrained-paystub-v2.0-2022-05-17
Kandidat Rilis
Tampilkan kolom
deduction_item
deduction_item/deduction_type
deduction_item/deduction_this_period
deduction_item/deduction_ytd
direct_deposit_item
direct_deposit_item/direct_deposit
direct_deposit_item/employee_account_number
earning_item
earning_item/earning_type
earning_item/earning_rate
earning_item/earning_hours
earning_item/earning_this_period
earning_item/earning_ytd
page_number
tax_item
tax_item/tax_type
tax_item/tax_this_period
tax_item/tax_ytd
federal_additional_tax
federal_allowance
federal_marital_status
state_additional_tax
state_allowance
state_marital_status
Versi ini mengasumsikan bahwa file input berisi satu slip gaji. Tidak seperti versi default, versi ini tidak memeriksa file input untuk slip gaji dan tidak akan menampilkan error jika tidak ada slip gaji yang ditemukan.
Peningkatan kualitas, dukungan kolom baru, dan skema baru. Bonus, Komisi, Liburan, Lembur, Gaji Reguler, dan Cuti kini menjadi bagian dari earning_item/earning_this_period, dan versi tahun berjalan ada di earning_item/earning_ytd. Setoran Langsung dan Nomor Rekening Karyawan kini berada di bawah direct_deposit_item.
Ekstrak teks dan nilai dari invoice seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo.
Parser invoice mengekstrak kolom header dan item baris, seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo, dan jumlah item baris.
[*] Pemroses ini hanya tersedia untuk pelanggan dengan akses terbatas.
Untuk meminta akses API, isi dan kirimkan
formulir permintaan pelanggan akses
terbatas Document AI.
Formulir tersebut meminta informasi tentang Anda, perusahaan Anda, dan kasus penggunaan Anda.
Perhatikan bahwa Project ID Google Cloud diperlukan untuk mendapatkan akses.
Untuk membuat project Google Cloud baru atau mengidentifikasi Project ID
dari project Anda yang sudah ada, lihat
petunjuk berikut.
Setelah Anda mengirimkan formulir, tim Document AI akan
meninjau permintaan Anda untuk memastikan Anda memenuhi kriteria akses.
Jika disetujui, Anda akan menerima email berisi petunjuk tentang cara mengakses
dan menggunakan fitur ini.
[†]
Pembuktian Dokumen Identitas berfungsi untuk mengekstrak dan mengevaluasi informasi dari dokumen identitas yang berkontribusi untuk mengidentifikasi apakah gambar input merepresentasikan tanda pengenal yang asli.
Di Google Cloud, kami memprioritaskan untuk membantu pelanggan mengembangkan dan mengimplementasikan solusi AI dengan aman, dan Pembuktian Identitas telah dikembangkan sesuai dengan Prinsip AI Google.
Berdasarkan Prinsip AI Google dan desain produk saat ini, sebaiknya Anda berhati-hati dan mengevaluasi dengan cermat potensi manfaat dan risiko penggunaan Verifikasi Dokumen Identitas untuk hal-hal berikut:
Pengambilan keputusan tanpa campur tangan manusia untuk prediksi yang dapat memengaruhi hak asasi manusia.
Di domain sensitif, termasuk, tetapi tidak terbatas pada, pekerjaan, akses ke layanan publik, kesehatan, dan konteks yang sangat penting untuk keselamatan.
[‡] Selalu gunakan Pembuktian Identitas sebagai bagian dari proses dan alur kerja deteksi identitas yang lebih luas.
Anda harus memiliki peninjau manual dalam alur kerja untuk memverifikasi apakah sinyal yang diprediksi akurat atau tidak. Prosesor Pembuktian Identitas tidak dimaksudkan untuk menggantikan peninjauan ID oleh manusia dalam alur kerja, melainkan untuk membantu peninjau manusia dalam memvalidasi dokumen ID. Prosesor Pembuktian Identitas tidak boleh digunakan sebagai alat keputusan otomatis untuk menentukan apakah tanda pengenal valid atau tidak. Dengan peninjauan manual, pelanggan dapat mencapai akurasi pemrosesan dokumen yang lebih tinggi dan membantu bisnis mengevaluasi prediksi menggunakan alat yang dibuat khusus untuk mendukung peninjauan tersebut.
Pastikan Anda meninjau peraturan di wilayah tempat Anda menerapkan teknologi ini, dan meneliti panduan industri yang ada untuk mempelajari pedoman kebijakan dan masalah keadilan umum. Baca tentang keadilan dalam machine learning, termasuk cara mengurangi bias dalam set data pelatihan, mengevaluasi model kustom Anda untuk mendeteksi kesenjangan performa, dan pertimbangan lainnya saat Anda menggunakan model kustom Anda.
Kami mendorong pelanggan untuk selalu mempertimbangkan praktik terbaik keadilan, kemampuan interpretasi, serta privasi dan keamanan saat menerapkan fitur Verifikasi Identitas. Untuk mempelajari lebih lanjut cara menerapkan AI yang bertanggung jawab, baca rekomendasi Google untuk praktik Responsible AI.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-07-14 UTC."],[[["Document AI offers various processors for digitizing, extracting, classifying, and summarizing document content, including Enterprise Document OCR for text recognition in over 200 languages."],["Custom Extractor uses generative AI or custom models to extract fields from documents, supporting multiple languages and specific data types, such as `dateTime`, `currency`, `number`, and has different versions with varying functionalities and lifespans."],["Form Parser extracts key-value pairs, checkboxes, tables, and entities from documents in over 200 languages, utilizing machine learning and deep learning techniques, and is capable of extracting fields such as `email`, `phone`, `url`, `date_time`, and more."],["Layout Parser, available for files such as PDF, HTML and DOCX, extracts content elements like text, tables and lists, supports a wide array of languages, and allows for processing up to 15 pages online or 500 in batch."],["Specialized pretrained processors like Bank Statement Parser, W2 Parser, US Passport Parser, Utility Parser, Identity Document Proofing Parser, Pay Slip Parser, US Driver License Parser, Expense Parser, and Invoice Parser are available for extracting specific information from different document types."]]],[]]