Pengekstrak kustom dengan AI generatif

Pelatihan dan ekstraksi AI generatif memungkinkan Anda:

  • Gunakan teknologi zero-shot dan few-shot untuk mendapatkan model berperforma tinggi dengan sedikit atau tanpa data pelatihan menggunakan model dasar.
  • Gunakan penyesuaian untuk lebih meningkatkan akurasi saat Anda memberikan lebih banyak data pelatihan.

Metode pelatihan AI generatif

Metode pelatihan yang Anda pilih bergantung pada jumlah dokumen yang tersedia dan upaya yang dapat Anda lakukan untuk melatih model. Ada tiga cara untuk melatih model AI generatif:

Metode pelatihan Zero-shot Few-shot Fine tuning
Akurasi Sedang Sedang-tinggi Tinggi
Upaya Rendah Rendah Sedang
Jumlah dokumen pelatihan yang direkomendasikan 0 5 hingga 10 10 hingga 50+

Versi model ekstraktor kustom

Model berikut tersedia untuk ekstraktor kustom. Untuk mengubah versi model, lihat Mengelola versi pemroses.

Versi 1.3, 1.4, dan 1.5 mendukung skor keyakinan, sedangkan versi 1.2 tidak.

Versi model Deskripsi Stabil Pemrosesan ML di Amerika Serikat/Uni Eropa Penyesuaian di Amerika Serikat/Uni Eropa Tanggal rilis
pretrained-foundation-model-v1.4-2025-02-05 Kandidat rilis yang didukung oleh LLM Gemini 2.0 Flash. Mendukung kuota hingga 120 halaman per menit untuk permintaan proses online. Juga mencakup fitur OCR tingkat lanjut seperti deteksi kotak centang. Ya Ya Amerika Serikat, Uni Eropa (Pratinjau) 5 Februari 2025
pretrained-foundation-model-v1.5-2025-05-05 Model GA yang didukung oleh LLM Gemini 2.5 Flash. Mendukung kuota hingga 15 halaman per menit untuk permintaan pemrosesan online. Direkomendasikan untuk orang yang ingin bereksperimen dengan model yang lebih baru. Ya Ya Amerika Serikat, Uni Eropa 5 Mei 2025

Untuk mengubah versi pemroses dalam project Anda, tinjau Mengelola versi pemroses.

Penyiapan awal

Jika belum melakukannya, aktifkan penagihan dan Document AI API.

Membangun dan mengevaluasi model AI generatif

  1. Buat pemroses dan tentukan kolom yang ingin Anda ekstrak dengan mengikuti praktik terbaik, yang penting karena memengaruhi kualitas ekstraksi.

    • Buka Workbench > Custom extractor > Create processor > Assign a name.

    processor-version-genai-1

    • Buka Mulai > Buat kolom baru.

    processor-version-genai-2

  2. Mengimpor dokumen

    • Impor dokumen dengan pelabelan otomatis dan tetapkan dokumen ke set pelatihan dan pengujian.
    • Untuk zero-shot, hanya skema yang diperlukan. Untuk mengevaluasi akurasi model, hanya set pengujian yang diperlukan.
    • Untuk few-shot, sebaiknya gunakan lima dokumen pelatihan.
    • Jumlah dokumen pengujian yang diperlukan bergantung pada kasus penggunaan. Umumnya, semakin banyak dokumen pengujian, semakin baik.
    • Konfirmasi atau edit label dalam dokumen.
  3. Melatih model:

    • Pilih Build, lalu Create new version.
    • Masukkan nama, lalu pilih Buat.

    processor-version-genai-12

  1. Evaluasi:

    • Buka Evaluasi & uji, pilih versi yang baru saja Anda latih, lalu pilih Lihat evaluasi lengkap.

    processor-version-genai-13

    • Sekarang Anda akan melihat metrik seperti f1, presisi, dan perolehan untuk seluruh dokumen dan setiap kolom.
    • Tentukan apakah performa memenuhi sasaran produksi Anda. Jika tidak, evaluasi ulang set pelatihan dan pengujian.
  2. Menetapkan versi baru sebagai default:

    • Buka Kelola versi.
    • Pilih untuk meluaskan opsi, lalu pilih Tetapkan sebagai default.

    processor-version-genai-14

    Model Anda kini telah di-deploy. Dokumen yang dikirim ke pemroses ini menggunakan versi kustom Anda. Anda dapat mengevaluasi performa model untuk memeriksa apakah model memerlukan pelatihan lebih lanjut.

Referensi evaluasi

Mesin evaluasi dapat melakukan pencocokan persis atau pencocokan tidak persis. Untuk kecocokan persis, nilai yang diekstrak harus sama persis dengan data sebenarnya atau dihitung sebagai tidak cocok.

Ekstraksi pencocokan fuzzy yang memiliki sedikit perbedaan seperti perbedaan kapitalisasi tetap dihitung sebagai kecocokan. Setelan ini dapat diubah di layar Evaluasi.

processor-version-genai-15

Fine tuning

Dengan penyempurnaan, Anda menggunakan ratusan atau ribuan dokumen untuk pelatihan.

  1. Buat pemroses dan tentukan kolom yang ingin Anda ekstrak dengan mengikuti praktik terbaik, yang penting karena memengaruhi kualitas ekstraksi.

  2. Impor dokumen dengan pemberian label otomatis, dan tetapkan dokumen ke set pelatihan dan pengujian.

  3. Konfirmasi atau edit label dalam dokumen.

  4. Latih model.

    • Pilih tab Build, lalu pilih Create New Version di kotak Fine-tuning.

    processor-version-genai-24

    • Coba parameter atau nilai pelatihan default yang diberikan. Jika hasilnya tidak memuaskan, coba opsi lanjutan berikut:

    • Langkah pelatihan (antara 100 dan 400): Mengontrol seberapa sering bobot dioptimalkan pada batch data selama penyesuaian.

      • Nilai yang terlalu rendah menunjukkan risiko bahwa pelatihan berakhir sebelum konvergensi (kurang sesuai).
      • Nilai yang terlalu tinggi berarti model mungkin melihat batch data yang sama beberapa kali selama pelatihan, yang dapat menyebabkan overfitting.
      • Lebih sedikit langkah akan menghasilkan waktu pelatihan yang lebih cepat. Jumlah yang lebih tinggi dapat membantu dokumen dengan sedikit variasi template (dan jumlah yang lebih rendah untuk dokumen dengan lebih banyak variasi).
    • Pengali kecepatan pembelajaran (antara 0,1 dan 10): Mengontrol seberapa cepat parameter model dioptimalkan pada data pelatihan. Nilai ini kurang lebih sesuai dengan ukuran setiap langkah pelatihan.

      • Tingkat yang rendah berarti perubahan kecil pada bobot model di setiap langkah pelatihan. Jika terlalu rendah, model mungkin tidak akan mencapai solusi yang stabil.
      • Rasio yang tinggi menunjukkan perubahan besar, dan jika terlalu tinggi, model dapat melampaui solusi optimal dan malah menyatu dengan solusi yang kurang optimal.
      • Waktu pelatihan tidak terpengaruh oleh pilihan laju pembelajaran.
    • Beri nama, pilih versi prosesor dasar yang diperlukan, lalu pilih Buat.

    processor-version-genai-21

  5. Evaluasi: Buka Evaluasi & pengujian, lalu pilih versi yang baru saja Anda latih dan pilih Lihat evaluasi lengkap.

    processor-version-genai-13

    • Sekarang Anda akan melihat metrik seperti f1, presisi, dan perolehan untuk seluruh dokumen dan setiap kolom.
    • Tentukan apakah performa memenuhi sasaran produksi Anda. Jika tidak, dokumentasi pelatihan lebih lanjut mungkin diperlukan.
  6. Menetapkan versi baru sebagai default:

    • Buka Kelola versi.
    • Pilih untuk meluaskan opsi, lalu pilih Tetapkan sebagai default.

    processor-version-genai-14

    Model Anda kini di-deploy dan dokumen yang dikirim ke pemroses ini kini menggunakan versi kustom Anda. Anda ingin mengevaluasi performa model untuk memeriksa apakah model memerlukan pelatihan lebih lanjut.

Pelabelan otomatis dengan model dasar

Model dasar dapat secara akurat mengekstrak kolom untuk berbagai jenis dokumen, tetapi Anda juga dapat memberikan data pelatihan tambahan untuk meningkatkan akurasi model untuk struktur dokumen tertentu.

Document AI menggunakan nama label yang Anda tentukan dan anotasi sebelumnya untuk mempermudah dan mempercepat pelabelan dokumen dalam skala besar dengan pelabelan otomatis.

  1. Setelah Anda membuat pemroses kustom, buka tab Mulai.
  2. Pilih Buat Kolom Baru.
  3. Beri label nama yang deskriptif dan berbeda. Hal ini akan meningkatkan akurasi dan performa model dasar.

    processor-version-genai-17

  4. Untuk akurasi dan performa ekstraksi, tambahkan deskripsi (seperti konteks tambahan, insight, dan pengetahuan sebelumnya untuk setiap entitas) untuk jenis entitas yang harus diambil.

    processor-version-genai-23

  5. Buka tab Build, lalu pilih Impor Dokumen.

    processor-version-genai-18

  6. Pilih jalur dokumen dan kumpulan dokumen yang akan diimpor. Centang opsi pemberian label otomatis dan pilih model dasar.

  7. Di tab Build, pilih Kelola Set Data.

  8. Saat Anda melihat dokumen yang diimpor, pilih salah satunya.

    processor-version-genai-19

Prediksi dari model kini ditampilkan dengan warna ungu.

  1. Tinjau setiap label yang diprediksi oleh model, dan pastikan label tersebut benar.
  2. Jika ada kolom yang tidak ada, tambahkan juga kolom tersebut.

    processor-version-genai-20

  3. Setelah dokumen ditinjau, pilih Tandai sebagai Berlabel. Dokumen kini siap digunakan oleh model.

  4. Pastikan dokumen berada dalam set pengujian atau pelatihan.

Penyusunan tiga tingkat

Pengekstrak Kustom kini menyediakan tiga tingkat penyusunan bertingkat. Fitur ini memberikan ekstraksi yang lebih baik untuk tabel yang kompleks.

Anda dapat menentukan jenis model menggunakan panggilan API berikut:

Responsnya adalah ProcessorVersion, yang berisi kolom modelType dalam pratinjau v1beta3.

Prosedur dan contoh

Kita menggunakan contoh ini:

processor-version-genai-3

  1. Pilih Mulai, lalu buat kolom:

    • Buat tingkat teratas.
    • Dalam contoh ini, officer_appointments digunakan.
    • Pilih Ini adalah label induk.
    • Pilih Kemunculan: Optional multiple.

    processor-version-genai-4 processor-version-genai-5 processor-version-genai-6

  2. Pilih Tambahkan kolom turunan. Label tingkat kedua kini dapat dibuat:

    • Untuk label tingkat ini, buat officer.
    • Pilih Ini adalah label induk.
    • Pilih Kemunculan: Optional multiple.

    processor-version-genai-7 processor-version-genai-8

  3. Pilih Tambahkan kolom turunan dari officer tingkat kedua. Buat label turunan untuk tingkat ketiga penataan. processor-version-genai-9

  4. Setelah skema Anda ditetapkan, Anda bisa mendapatkan prediksi dari dokumen dengan tiga tingkat penyusunan menggunakan pelabelan otomatis.

    processor-version-genai-10 processor-version-genai-11

Memberi label pada entitas bertingkat lintas halaman

Prosesor pretrained-foundation-model-v1.5-2025-05-05 mendukung susunan tiga tingkat di seluruh halaman.

  1. Beri label pada entity secara normal di seluruh halaman. Catatan: Entitas berlabel hanya akan terlihat di halaman tempat entitas tersebut diberi label, dengan menu navigasi yang berubah dari halaman ke halaman. Dengan menyematkan entitas induk, menu navigasi ini akan tetap ada.

    processor-version-genai-25

  2. Sematkan entitas induk dengan turunan yang ingin Anda beri label di seluruh halaman.

    processor-version-genai-26

  3. Buka halaman yang berisi entitas turunan yang akan diberi label.

processor-version-genai-27

Konfigurasi set data

Set data dokumen diperlukan untuk melatih, melatih ulang, atau mengevaluasi versi pemroses. Prosesor Document AI belajar dari contoh, seperti halnya manusia. Set data memicu stabilitas prosesor dalam hal performa.

Set data pelatihan

Untuk meningkatkan model dan akurasinya, latih set data pada dokumen Anda. Model terdiri dari dokumen dengan kebenaran dasar.
  • Untuk penyesuaian, Anda memerlukan minimal 1 dokumen untuk melatih model baru dengan versi untuk pretrained-foundation-model-v1.2-2024-05-10 dan pretrained-foundation-model-v1.3-2024-08-31.
  • Untuk few-shot, sebaiknya gunakan lima dokumen.
  • Untuk zero-shot, hanya skema yang diperlukan.

Set data pengujian

Set data pengujian adalah yang digunakan model untuk menghasilkan skor F1 (akurasi). Set data ini terdiri dari dokumen dengan kebenaran dasar. Untuk melihat seberapa sering model benar, kebenaran dasar digunakan untuk membandingkan prediksi model (kolom yang diekstrak dari model) dengan jawaban yang benar. Set data pengujian harus memiliki minimal satu dokumen untuk pretrained-foundation-model-v1.2-2024-05-10 dan pretrained-foundation-model-v1.3-2024-08-31.

Pengekstrak kustom dengan deskripsi properti

Dengan deskripsi properti, Anda dapat melatih model dengan mendeskripsikan seperti apa kolom berlabel tersebut. Anda dapat memberikan konteks dan insight tambahan untuk setiap entitas. Hal ini memungkinkan model dilatih dengan mencocokkan kolom yang sesuai dengan deskripsi yang Anda berikan dan meningkatkan akurasi ekstraksi. Deskripsi properti dapat ditentukan untuk entitas induk dan turunan.

Contoh deskripsi properti yang baik mencakup informasi lokasi dan pola teks nilai properti, yang membantu memperjelas potensi sumber kebingungan dalam dokumen. Deskripsi properti yang jelas dan tepat memandu model dengan aturan yang meningkatkan ekstraksi yang lebih andal dan konsisten, terlepas dari struktur dokumen atau variasi konten tertentu.

Memperbarui skema dokumen untuk pemroses

Untuk mengetahui cara menetapkan deskripsi properti, lihat Memperbarui skema dokumen.

Mengirim permintaan pemrosesan dengan deskripsi properti

Jika skema dokumen sudah memiliki deskripsi yang ditetapkan, Anda dapat mengirim permintaan pemrosesan dengan petunjuk di Mengirim permintaan pemrosesan.

Menyesuaikan pemroses dengan deskripsi properti

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • LOCATION: lokasi pemroses Anda, misalnya:
    • us - Amerika Serikat
    • eu - Uni Eropa
  • PROJECT_ID: ID project Google Cloud Anda.
  • PROCESSOR_ID: ID pemroses kustom Anda.
  • DISPLAY_NAME: Nama tampilan untuk pemroses.
  • PRETRAINED_PROCESSOR_VERSION: ID versi prosesor. Lihat Memilih versi prosesor untuk mengetahui informasi selengkapnya. Contoh:
    • pretrained-TYPE-vX.X-YYYY-MM-DD
    • stable
    • rc
  • TRAIN_STEPS: Langkah-langkah pelatihan untuk penyesuaian model.
  • LEARN_RATE_MULTIPLIER: Pengganda laju pembelajaran untuk penyesuaian model.
  • DOCUMENT_SCHEMA: Skema untuk pemroses. Lihat representasi DocumentSchema.

Metode HTTP dan URL:

POST https://LOCATION-documentai.googleapis.com/v1beta3/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:process

Isi JSON permintaan:

{
  "rawDocument": {
      "parent": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID",
         "processor_version": {
             "name": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/DISPLAY_NAME",
             "display_name": "DISPLAY_NAME",
             "model_type": "MODEL_TYPE_GENERATIVE",
         },
         "base_processor_version": "projects/PROJECT_ID/locations/us/processors/PROCESSOR_ID/processorVersions/PRETRAINED_PROCESSOR_VERSION",
         "foundation_model_tuning_options": {
             "train_steps": TRAIN_STEPS,
             "learning_rate_multiplier": LEARN_RATE_MULTIPLIER,
         }
         "document_schema": DOCUMENT_SCHEMA
      }
}

Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:

curl

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-documentai.googleapis.com/v1beta3/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:process"

PowerShell

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-documentai.googleapis.com/v1beta3/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:process" | Select-Object -Expand Content

Langkah berikutnya

Melatih ulang pemroses khusus