Daftar pemroses

Halaman ini berisi informasi mendetail tentang semua pemroses yang ditawarkan oleh Document AI. Anda dapat melihat daftar semua pemroses menurut jenis solusi.

Semua pemroses Document AI mematuhi Persyaratan Pemrosesan dan Keamanan Data.

Lihat dokumentasi Mengelola versi pemroses untuk mengetahui detail selengkapnya. Selain kuota dan batas produk secara keseluruhan, batas prosesor tertentu juga berlaku.

Mendigitalkan teks

Enterprise Document OCR (Pengenalan Karakter Optik)

Deskripsi

Mengidentifikasi dan mengekstrak teks dalam berbagai jenis dokumen.

Prosesor ini memungkinkan Anda mengidentifikasi dan mengekstrak teks, termasuk teks tulis tangan, dari dokumen dalam lebih dari 200 bahasa. Prosesor juga menggunakan machine learning untuk melakukan penilaian kualitas dokumen berdasarkan keterbacaan kontennya.

Kategori Mendigitalkan
Fungsi OCR, Analisis Kualitas
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API OCR_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Albania sq Latn
Arab ar Arab
Armenia hy Armn
Belarusia be Cyrl
Bangla bn Beng
Bengali bn Beng
Bulgaria bg Cyrl
Catalan ca Latn
China zh Hani
Kroasia hr Latn
Ceko cs Latn
Denmark da Latn
Belanda nl Latn
Inggris en Latn
Estonia et Latn
Filipina fil Latn
Finlandia fi Latn
Prancis fr Latn
Jerman de Latn
Yunani el Grek
Gujarati gu Gujr
Ibrani iw Hebr
Hindi hi Deva
Hungaria hu Latn
Islan is Latn
Indonesia id Latn
Italia it Latn
Jepang ja Jpan
Kannada kn Knda
Khmer km Khmr
Korea ko Kore
Laos lo Laoo
Latvia lv Latn
Lituania lt Latn
Makedonia mk Cyrl
Melayu ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepal ne Deva
Norwegia no Latn
Persia fa Arab
Polandia pl Latn
Portugis (Portugal & Brasil) pt Latn
Punjabi pa Guru
Rumania ro Latn
Rusia ru Cyrl
Serbia sr Cyrl
Slovakia sk Latn
Slovenia sl Latn
Spanyol es Latn
Swedia sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thai th Thai
Turki tr Latn
Ukraina uk Cyrl
Vietnam vi Latn
Yiddish yi Hebr
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-ocr-v1.2-2022-11-10 Stabil Versi model yang dibekukan v1.0: File model, konfigurasi, dan biner snapshot versi yang dibekukan dalam image container hingga 18 bulan.
pretrained-ocr-v2.0-2023-06-02 Stabil Model siap produksi yang dikhususkan untuk kasus penggunaan dokumen. Mencakup akses ke semua add-on OCR.
pretrained-ocr-v2.1-2024-08-07 Stabil Area utama peningkatan untuk v2.1 adalah: pengenalan teks cetak yang lebih baik, deteksi kotak centang yang lebih presisi, dan urutan baca yang lebih akurat.
pretrained-ocr-v2.1.1-2025-01-31 Kandidat rilis v2.1.1 mirip dengan V2.1, dan tersedia di semua wilayah kecuali: US, EU, dan asia-southeast1.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 500
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Enterprise Document OCR

Mengekstrak entity dari dokumen

Lihat Set data sampel untuk set data berlabel dan tidak berlabel sampel yang akan digunakan untuk pelatihan.

Pengekstrak Kustom

Deskripsi

Ekstrak kolom dari dokumen menggunakan AI generatif atau model kustom; sesuaikan model agar dapat mengekstrak data dari dokumen Anda secara akurat.

Kategori Ekstrak
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API CUSTOM_EXTRACTION_PROCESSOR
Catatan
  • Jika menggunakan AI generatif untuk ekstraksi, maka:

    • Hanya bahasa Inggris yang didukung secara resmi.
    • Ketersediaan wilayah ada di US, EU, northamerica-northeast1, dan asia-southeast1.

Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Arab ar Arab
Azerbaijani az Latn
Azerbaijan (Sirilik) az-Cyrl Cyrl
Belarusia be Cyrl
Bulgaria bg Cyrl
Bosnia bs Latn
Catalan ca Latn
Cebuano ceb Latn
Ceko cs Latn
Wales cy Latn
Denmark da Latn
Jerman de Latn
Yunani el Grek
Inggris en Latn
Esperanto eo Latn
Spanyol es Latn
Estonia et Latn
Basque eu Latn
Persia fa Arab
Finlandia fi Latn
Filipina fil Latn
Prancis fr Latn
Irlandia ga Latn
Galisia gl Latn
Hindi hi Deva
Kroasia hr Latn
Kreol Haiti ht Latn
Hungaria hu Latn
Indonesia id Latn
Islan is Latn
Italia it Latn
Ibrani iw Hebr
Jepang ja Jpan
Jawa jv Latn
Kazak kk Cyrl
Korean ko Kore
Kyrgyz ky Cyrl
Latin la Latn
Lituania lt Latn
Latvia lv Latn
Makedonia mk Cyrl
Mongolia mn Cyrl
Marathi mr Deva
Melayu ms Latn
Malta mt Latn
Nepal ne Deva
Belanda nl Latn
Norwegia no Latn
Polandia pl Latn
Pashto ps Arab
Portugis (Portugal & Brasil) pt Latn
Rumania ro Latn
Rusia ru Cyrl
Rusia (Ortografi Petrine) ru-PETR1708 Cyrl
Sanskrit sa Deva
Slovakia sk Latn
Slovenia sl Latn
Albania sq Latn
Serbia sr Cyrl
Swedia sv Latn
Swahili sw Latn
Tagalog tl Latn
Turki tr Latn
Ukraina uk Cyrl
Urdu ur Arab
Uzbekistan uz Latn
Uzbekistan (Sirilik) uz-Cyrl Cyrl
Vietnam vi Latn
Yiddish yi Hebr
China aksara sederhana zh-Hans Hani
China tradisional zh-Hant Hani
Zulu zu Latn
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-foundation-model-v1.4-2025-02-05 Stabil Kandidat siap produksi yang didukung oleh LLM Gemini 2.0 Flash. Juga mencakup fitur OCR tingkat lanjut seperti deteksi kotak centang.
pretrained-foundation-model-v1.5-2025-05-05 Stabil Kandidat siap produksi yang didukung oleh LLM Gemini 2.5 Flash. Direkomendasikan bagi mereka yang ingin bereksperimen dengan model yang lebih baru.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Jenis data yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi, dan Buat set data.

Daftar lengkap jenis data yang dinormalisasi
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Pengekstrak Kustom

Form Parser

Deskripsi

Mengekstrak pasangan nilai kunci umum (entity dan kotak centang), tabel, dan entity generik dari dokumen selain teks OCR.

Pemroses ini menerapkan teknologi machine learning canggih untuk mengekstrak pasangan nilai kunci, kotak centang, dan tabel dari dokumen dalam lebih dari 200 bahasa. Prosesor ini juga memanfaatkan model deep learning untuk mengekstrak 11 entity generik yang umum dalam berbagai jenis dokumen.

Kategori Ekstrak
Fungsi OCR, Penguraian Formulir, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API FORM_PARSER_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Albania sq Latn
Arab ar Arab
Belarusia be Cyrl
Catalan ca Latn
China zh Hani
Kroasia hr Latn
Ceko cs Latn
Denmark da Latn
Belanda nl Latn
Inggris en Latn
Estonia et Latn
Filipina fil Latn
Finlandia fi Latn
Prancis fr Latn
Jerman de Latn
Ibrani iw Hebr
Hindi hi Deva
Hungaria hu Latn
Islan is Latn
Indonesia id Latn
Italia it Latn
Jepang ja Jpan
Korean ko Kore
Latvia lv Latn
Lituania lt Latn
Makedonia mk Cyrl
Melayu ms Latn
Marathi mr Deva
Nepal ne Deva
Norwegia no Latn
Persia fa Arab
Polandia pl Latn
Portugis (Portugal & Brasil) pt Latn
Rumania ro Latn
Rusia ru Cyrl
Serbia sr Cyrl
Slovakia sk Latn
Slovenia sl Latn
Spanyol es Latn
Swedia sv Latn
Tagalog tl Latn
Turki tr Latn
Ukraina uk Cyrl
Vietnam vi Latn
Yiddish yi Hebr
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Deskripsi
pretrained-form-parser-v1.0-2020-09-23 Stabil

Tidak ada

Versi lama. Untuk kualitas terbaik dan set fitur lengkap, gunakan Form Parser v2.0.
pretrained-form-parser-v2.0-2022-11-10 Stabil
Tampilkan kolom
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
Versi yang direkomendasikan. Mendukung entitas generik dan menyertakan model tabel, KVP, dan kotak centang yang ditingkatkan, serta lebih dari 200 bahasa.
pretrained-form-parser-v2.1-2023-06-26 Kandidat Rilis

Tidak ada

Versi Pratinjau Publik. Model yang sama dengan v2.0 dengan ekstraksi teks native dari file PDF digital yang diaktifkan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 100
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Parser Formulir

Parser Tata Letak

Deskripsi

Mengekstrak elemen konten dokumen (teks, tabel, dan daftar) serta membuat potongan kontekstual.

Layout Parser mengekstrak elemen konten dokumen seperti teks, tabel, dan daftar, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam AI generatif dan aplikasi penemuan.

Kategori Ekstrak
Fungsi Penguraian Tata Letak, Pemotongan Dokumen
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API LAYOUT_PARSER_PROCESSOR
Catatan
  • Parser ini mendukung file PDF, HTML, dan DOCX.
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Albania sq Latn
Arab ar Arab
Armenia hy Armn
Belarusia be Cyrl
Bangla bn Beng
Bengali bn Beng
Bulgaria bg Cyrl
Catalan ca Latn
China zh Hani
Kroasia hr Latn
Ceko cs Latn
Denmark da Latn
Belanda nl Latn
Inggris en Latn
Estonia et Latn
Filipina fil Latn
Finlandia fi Latn
Prancis fr Latn
Jerman de Latn
Yunani el Grek
Gujarati gu Gujr
Ibrani iw Hebr
Hindi hi Deva
Hungaria hu Latn
Islan is Latn
Indonesia id Latn
Italia it Latn
Jepang ja Jpan
Kannada kn Knda
Khmer km Khmr
Korea ko Kore
Laos lo Laoo
Latvia lv Latn
Lituania lt Latn
Makedonia mk Cyrl
Melayu ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepal ne Deva
Norwegia no Latn
Persia fa Arab
Polandia pl Latn
Portugis (Portugal & Brasil) pt Latn
Punjabi pa Guru
Rumania ro Latn
Rusia ru Cyrl
Serbia sr Cyrl
Slovakia sk Latn
Slovenia sl Latn
Spanyol es Latn
Swedia sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thai th Thai
Turki tr Latn
Ukraina uk Cyrl
Vietnam vi Latn
Yiddish yi Hebr
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-layout-parser-v1.0-2024-06-03 Stabil Versi yang direkomendasikan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 500
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us
Informasi selengkapnya Layout Parser

Menjelajahi prosesor terlatih

Parser Laporan Mutasi Bank

Deskripsi

Mengekstrak dari laporan mutasi bank, termasuk nama, rekening, transaksi, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API BANK_STATEMENT_PROCESSOR
Catatan
  • Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-bankstatement-v1.0-2021-08-08 Stabil
pretrained-bankstatement-v1.1-2021-08-13 Stabil
pretrained-bankstatement-v2.0-2021-12-10 Stabil
pretrained-bankstatement-v3.0-2022-05-16 Stabil Versi ini mengasumsikan bahwa file input berisi satu laporan bank. Tidak seperti versi default, versi ini tidak memeriksa file input untuk laporan mutasi bank dan tidak akan menampilkan error jika tidak ada laporan mutasi bank yang ditemukan.
pretrained-bankstatement-v4.0-2023-07-31 Kandidat Rilis
pretrained-bankstatement-v5.0-2023-12-06 Kandidat Rilis

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 30
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya
  • bank_address
  • bank_name
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser W2

Deskripsi

Ekstrak dari Formulir W2, termasuk karyawan, perusahaan, upah, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API FORM_W2_PROCESSOR
Catatan
  • Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Formulir/versi yang didukung
  • 2020 (versi standar dan yang disesuaikan)
  • 2019 (versi standar dan yang disesuaikan)
  • 2018 (versi standar dan yang disesuaikan)
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Deskripsi
pretrained-w2-v1.0-2020-10-01 Stabil

Tidak ada

pretrained-w2-v1.1-2022-01-27 Stabil

Tidak ada

pretrained-w2-v1.2-2022-01-28 Stabil
Tampilkan kolom
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Peningkatan kualitas dan dukungan untuk kolom baru; tidak menyertakan pemisah.

pretrained-w2-v2.0-2022-03-30 Kandidat Rilis
Tampilkan kolom
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Peningkatan kualitas dan dukungan untuk kolom 12 kotak serta prediksi EmployeeName, EmployeeAddress, dan EmployerNameAndAddress yang lebih akurat, yang semuanya tidak lagi menjadi bagian dari output dan digantikan dengan kolom tambahan.

pretrained-w2-v2.1-2022-06-08 Stabil
Tampilkan kolom
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Mirip dengan versi pretrained-w2-v2.0-2022-03-30 dengan peningkatan kualitas lebih lanjut dan memperkenalkan satu entity lagi, yaitu EmployeeName_Suffix.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 15
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 15
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya
  • EmployerNameAndAddress
  • EIN
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Paspor Amerika Serikat

Deskripsi

Ekstrak kolom seperti nama, ID dokumen, tanggal lahir, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API US_PASSPORT_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-us-passport-v1.0-2021-06-14 Stabil

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 2
Halaman maksimum (permintaan batch/offline/asinkron): 2
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 2
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Utilitas

Deskripsi

Mengekstrak teks dan nilai dari tagihan utilitas seperti nama penyedia dan jumlah yang dibayarkan sebelumnya.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Terbatas [*]
Ketik API UTILITY_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-utility-v1.1-2021-04-09 Stabil
pretrained-utility-v1.2-2022-12-15 Kandidat Rilis

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 10
Halaman maksimum (permintaan batch/offline/asinkron): 200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Pemeriksaan Dokumen Identitas

Deskripsi

Memprediksi validitas dokumen identitas menggunakan beberapa sinyal.

Pemroses Pemeriksaan Dokumen Identitas dirancang untuk membantu memprediksi validitas dokumen identitas dengan empat sinyal yang berbeda.

Saat ini, pemroses menampilkan informasi dari sinyal berikut:

  • Deteksi fraud_signals_is_identity_document: Memprediksi apakah gambar berisi dokumen identitas yang diakui.
  • Deteksi fraud_signals_suspicious_words: Memprediksi apakah ada kata-kata yang tidak umum pada ID.
  • Deteksi fraud_signals_image_manipulation: Memprediksi apakah gambar telah diubah atau dimanipulasi dengan alat pengeditan gambar.
  • fraud_signals_online_duplicate deteksi: Memprediksi apakah gambar dapat ditemukan secara online (khusus Amerika Serikat).

Kategori Model terlatih
Fungsi OCR, Analisis Kualitas
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API ID_PROOFING_PROCESSOR
Catatan
  • Fitur Deteksi Duplikat Online saat ini diproses di pusat data AS. Dukungan regional dan multi-regional tidak tersedia untuk fitur ini di luar Amerika Serikat.
  • Prosesor ini didukung oleh algoritma yang diupdate lebih sering daripada rilis versi prosesor baru. Oleh karena itu, prosesor mungkin memberikan output yang berbeda dari waktu ke waktu meskipun menggunakan versi prosesor yang sama. Misalnya, sistem Deteksi Duplikat Online memantau gambar yang ada di web. Perilaku sistem kemudian dapat berubah lebih cepat daripada yang dapat dilacak dalam versi prosesor.
  • Lihat catatan tentang Responsible AI[†] dan Peninjauan oleh manusia.[‡]
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Formulir/versi yang didukung
  • Dukungan untuk paspor, kartu paspor, dan surat izin mengemudi Amerika Serikat.
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Deskripsi
pretrained-id-proofing-v1.0-2022-10-03 Stabil

Tidak ada

pretrained-id-proofing-v1.1-2023-05-18 Kandidat Rilis
Tampilkan kolom
  • fraud_signals_photocopy_detection

Sinyal deteksi fotokopi tambahan

pretrained-id-proofing-v1.2-2023-10-04 Kandidat Rilis
Tampilkan kolom
  • fraud_signals_photocopy_detection

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 2
Halaman maksimum (permintaan batch/offline/asinkron): 2
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 2
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Slip Gaji

Deskripsi

Mengekstrak dari slip gaji, termasuk nama, bisnis, jumlah, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API PAYSTUB_PROCESSOR
Catatan
  • Jika dokumen input multi-halaman berisi lebih dari satu slip gaji yang valid, pemroses hanya akan mengekstrak entitas dari slip gaji valid pertama. Jika tidak ada slip gaji yang ditemukan dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Deskripsi
pretrained-paystub-v1.0-2021-03-19 Stabil

Tidak ada

pretrained-paystub-v1.1-2021-08-13 Stabil
Tampilkan kolom
  • net_pay
  • net_pay_ytd
  • employee_account_number
Peningkatan kualitas dan dukungan kolom baru;
pretrained-paystub-v1.2-2021-12-10 Stabil

Tidak ada

pretrained-paystub-v2.0-2022-05-17 Kandidat Rilis
Tampilkan kolom
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Versi ini mengasumsikan bahwa file input berisi satu slip gaji. Tidak seperti versi default, versi ini tidak memeriksa file input untuk slip gaji dan tidak akan menampilkan error jika tidak ada slip gaji yang ditemukan.

Peningkatan kualitas, dukungan kolom baru, dan skema baru. Bonus, Komisi, Liburan, Lembur, Gaji Reguler, dan Cuti kini menjadi bagian dari earning_item/earning_this_period, dan versi tahun berjalan ada di earning_item/earning_ytd. Setoran Langsung dan Nomor Rekening Karyawan kini berada di bawah direct_deposit_item.

Batas halaman asinkron adalah 10.

pretrained-paystub-v2.0-2022-07-22 Stabil

Tidak ada

Peningkatan kualitas dan peningkatan pelatihan.

pretrained-paystub-v3.0-2023-12-06 Kandidat Rilis

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 50
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya
  • employer_address
  • employer_name
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Petunjuk Pelabelan Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser surat izin mengemudi (SIM) Amerika Serikat

Deskripsi

Ekstrak kolom seperti nama, ID dokumen, tanggal lahir, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API US_DRIVER_LICENSE_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Formulir/versi yang didukung
  • Mendukung seluruh 50 Negara Bagian dan D.C.
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-us-driver-license-v1.0-2021-06-14 Stabil

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 2
Halaman maksimum (permintaan batch/offline/asinkron): 2
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 2
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Pengeluaran

Deskripsi

Mengekstrak teks dan nilai dari dokumen pengeluaran seperti tanggal pengeluaran, nama penyedia, jumlah total, dan mata uang.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API EXPENSE_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Jerman de Latn
Inggris en Latn
Spanyol es Latn
Prancis fr Latn
Jepang ja Jpan
Belanda nl Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-expense-v1.1-2021-04-09 Stabil

Tidak ada

Tidak ada

Diluncurkan pada April 2021.
pretrained-expense-v1.3.2-2024-09-11 Kandidat Rilis
Tampilkan kolom
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Jepang
Upgrade ke v1.3 dengan model visi pokok yang ditingkatkan.
pretrained-expense-v1.4-2022-11-18 Kandidat Rilis
Tampilkan kolom
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Jepang
  • it: Italia
  • pt: Portugis (Portugal & Brasil)
Peningkatan performa dan dukungan untuk pelatihan ulang. Batas halaman maksimum (permintaan online/sinkron) telah ditingkatkan menjadi 15.
pretrained-expense-v1.4.2-2024-09-12 Kandidat Rilis
Tampilkan kolom
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Jepang
  • it: Italia
  • pt: Portugis (Portugal & Brasil)
Upgrade ke v1.4 dengan model visi pokok yang ditingkatkan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 10
Halaman maksimum (permintaan batch/offline/asinkron): 10
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 10
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya
  • supplier_address
  • supplier_name
  • supplier_phone
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Parser Invoice

Deskripsi

Ekstrak teks dan nilai dari invoice seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo.

Parser invoice mengekstrak kolom header dan item baris, seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo, dan jumlah item baris.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API INVOICE_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Jerman de Latn
Inggris en Latn
Spanyol es Latn
Estonia et Latn
Prancis fr Latn
Italia it Latn
Latvia lv Latn
Lituania lt Latn
Belanda nl Latn
Portugis (Portugal & Brasil) pt Latn
Rumania ro Latn
Swedia sv Latn
Versi prosesor
ID versi Saluran Rilis Bahasa tambahan yang didukung Deskripsi
pretrained-invoice-v1.1-2021-04-09 Stabil

Tidak ada

pretrained-invoice-v1.2-2022-02-18 Stabil

Tidak ada

Penghentian penggunaan akan segera dilakukan.
pretrained-invoice-v1.3-2022-07-15 Stabil
  • it: Italia
  • pt: Portugis (Portugal & Brasil)
  • ro: Rumania
  • sv: Swedia
  • et: Estonia
  • lv: Latvia
  • lt: Lituania
Versi pemroses yang dapat dilatih ulang. Jumlah maksimum halaman (permintaan online/sinkron) telah ditingkatkan menjadi 15.
pretrained-invoice-v1.4-2022-10-21 Kandidat Rilis

Tidak ada

Versi pemroses yang dapat dilatih ulang. Jumlah maksimum halaman (permintaan online/sinkron) telah ditingkatkan menjadi 15.
pretrained-invoice-v1.5-2023-09-15 Kandidat Rilis

Tidak ada

pretrained-invoice-v2.0-2023-12-06 Kandidat Rilis

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang diperkaya
  • supplier_address
  • supplier_name
  • supplier_phone
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Pengayaan & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Mengklasifikasikan dokumen

Pengklasifikasi Kustom

Deskripsi

Latih model untuk mengklasifikasikan jenis dokumen dari serangkaian kelas.

Kategori Klasifikasikan
Fungsi OCR, Klasifikasi
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API CUSTOM_CLASSIFICATION_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 200
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Membuat pemroses klasifikasi kustom

Pemisah Kustom

Deskripsi

Latih model untuk memisahkan file yang berisi beberapa dokumen menjadi dokumen individual yang diklasifikasikan.

Kategori Klasifikasikan
Fungsi OCR, Klasifikasi, Pemisahan
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API CUSTOM_SPLITTING_PROCESSOR
Catatan
  • i18n hanya dapat didukung melalui opsi pelatihan kustom.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 1000
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Membuat pemroses pemisah kustom

Meringkas dokumen

Peringkas

Deskripsi

Dapatkan ringkasan abstrak dan poin-poin penting untuk dokumen pendek dan panjang.

Kategori sudah dilatih
Fungsi Ringkasan
Tahap rilis Pratinjau
Status akses Publik
Ketik API SUMMARY_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Deskripsi
pretrained-foundation-model-v1.0-2023-08-22 Stabil Model dasar Google

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 250
Halaman maksimum (permintaan online/sinkron dalam mode tanpa gambar): 30
Uptraining
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • us
Informasi selengkapnya Perangkum kustom

Catatan kaki

[*] Pemroses ini hanya tersedia untuk pelanggan dengan akses terbatas.

Untuk meminta akses API, isi dan kirimkan formulir permintaan pelanggan akses terbatas Document AI. Formulir tersebut meminta informasi tentang Anda, perusahaan Anda, dan kasus penggunaan Anda. Perhatikan bahwa Project ID Google Cloud diperlukan untuk mendapatkan akses. Untuk membuat project Google Cloud baru atau mengidentifikasi Project ID dari project Anda yang sudah ada, lihat petunjuk berikut.

Setelah Anda mengirimkan formulir, tim Document AI akan meninjau permintaan Anda untuk memastikan Anda memenuhi kriteria akses. Jika disetujui, Anda akan menerima email berisi petunjuk tentang cara mengakses dan menggunakan fitur ini.

[†] Pembuktian Dokumen Identitas berfungsi untuk mengekstrak dan mengevaluasi informasi dari dokumen identitas yang berkontribusi untuk mengidentifikasi apakah gambar input merepresentasikan tanda pengenal yang asli.

Di Google Cloud, kami memprioritaskan untuk membantu pelanggan mengembangkan dan mengimplementasikan solusi AI dengan aman, dan Pembuktian Identitas telah dikembangkan sesuai dengan Prinsip AI Google.

Berdasarkan Prinsip AI Google dan desain produk saat ini, sebaiknya Anda berhati-hati dan mengevaluasi dengan cermat potensi manfaat dan risiko penggunaan Verifikasi Dokumen Identitas untuk hal-hal berikut:

  • Pengambilan keputusan tanpa campur tangan manusia untuk prediksi yang dapat memengaruhi hak asasi manusia.
  • Di domain sensitif, termasuk, tetapi tidak terbatas pada, pekerjaan, akses ke layanan publik, kesehatan, dan konteks yang sangat penting untuk keselamatan.

[‡] Selalu gunakan Pembuktian Identitas sebagai bagian dari proses dan alur kerja deteksi identitas yang lebih luas. Anda harus memiliki peninjau manual dalam alur kerja untuk memverifikasi apakah sinyal yang diprediksi akurat atau tidak. Prosesor Pembuktian Identitas tidak dimaksudkan untuk menggantikan peninjauan ID oleh manusia dalam alur kerja, melainkan untuk membantu peninjau manusia dalam memvalidasi dokumen ID. Prosesor Pembuktian Identitas tidak boleh digunakan sebagai alat keputusan otomatis untuk menentukan apakah tanda pengenal valid atau tidak. Dengan peninjauan manual, pelanggan dapat mencapai akurasi pemrosesan dokumen yang lebih tinggi dan membantu bisnis mengevaluasi prediksi menggunakan alat yang dibuat khusus untuk mendukung peninjauan tersebut.

Pastikan Anda meninjau peraturan di wilayah tempat Anda menerapkan teknologi ini, dan meneliti panduan industri yang ada untuk mempelajari pedoman kebijakan dan masalah keadilan umum. Baca tentang keadilan dalam machine learning, termasuk cara mengurangi bias dalam set data pelatihan, mengevaluasi model kustom Anda untuk mendeteksi kesenjangan performa, dan pertimbangan lainnya saat Anda menggunakan model kustom Anda.

Kami mendorong pelanggan untuk selalu mempertimbangkan praktik terbaik keadilan, kemampuan interpretasi, serta privasi dan keamanan saat menerapkan fitur Verifikasi Identitas. Untuk mempelajari lebih lanjut cara menerapkan AI yang bertanggung jawab, baca rekomendasi Google untuk praktik Responsible AI.

Lihat postingan blog Mengotomatiskan pemrosesan dokumen identitas dengan Document AI] untuk mengetahui informasi selengkapnya tentang kasus penggunaan dan repositori kode aplikasi contoh.