プロセッサ リスト

このページには、Document AI が提供するすべてのプロセッサの詳細情報が記載されています。ソリューション タイプ別にプロセッサのリストを表示できます。

すべての Document AI プロセッサは、データ処理およびセキュリティ規約に準拠しています。

詳細については、プロセッサ バージョンの管理に関するドキュメントをご覧ください。また、プロダクト全体の割り当てと上限に加えて、特定のプロセッサの上限が適用されます。

テキストをデジタル化する

Enterprise Document OCR(光学式文字認識)

説明

さまざまなタイプのドキュメントでテキストを識別して抽出します。

このプロセッサを使用すると、200 以上の言語のドキュメントから、手書きテキストを含むテキストを識別して抽出できます。また、このプロセッサは、機械学習を使用して、コンテンツの読みやすさに基づいてドキュメントの品質評価を行います。

カテゴリ デジタル化
関数 OCR、品質分析
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する OCR_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力対応
アフリカーンス語 af Latn
アルバニア語 sq Latn
アラビア語 ar Arab
アルメニア語 hy Armn
ベラルーシ語 be Cyrl
ベンガル語 bn Beng
ベンガル語 bn Beng
ブルガリア語 bg Cyrl
カタルーニャ語 ca Latn
中国語 zh Hani
クロアチア語 hr Latn
チェコ語 cs Latn
デンマーク語 da Latn
オランダ語 nl Latn
英語 en Latn
エストニア語 et Latn
フィリピン語 fil Latn
フィンランド語 fi Latn
フランス語 fr Latn
ドイツ語 de Latn
ギリシャ語 el Grek
グジャラート語 gu Gujr
ヘブライ語 iw Hebr
ヒンディー語 hi Deva
ハンガリー語 hu Latn
アイスランド語 is Latn
インドネシア語 id Latn
イタリア語 it Latn
日本語 ja Jpan
カンナダ語 kn Knda
クメール語 km Khmr
韓国語 ko Kore
ラオ語 lo Laoo
ラトビア語 lv Latn
リトアニア語 lt Latn
マケドニア語 mk Cyrl
マレー語 ms Latn
マラヤーラム語 ml Mlym
マラーティー語 mr Deva
ネパール語 ne Deva
ノルウェー語 no Latn
ペルシャ語 fa Arab
ポーランド語 pl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
パンジャブ語 pa Guru
ルーマニア語 ro Latn
ロシア語 ru Cyrl
セルビア語 sr Cyrl
スロバキア語 sk Latn
スロベニア語 sl Latn
スペイン語 es Latn
スウェーデン語 sv Latn
タガログ語 tl Latn
タミル語 ta Taml
テルグ語 te Telu
タイ語 th Thai
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-ocr-v1.2-2022-11-10 Stable フリーズされたモデル バージョン v1.0: コンテナ イメージで最大 18 か月間フリーズされたバージョン スナップショットのモデルファイル、構成、バイナリ。
pretrained-ocr-v2.0-2023-06-02 Stable ドキュメント ユースケースに特化した本番環境対応モデル。すべての OCR アドオンへのアクセス権が含まれます。
pretrained-ocr-v2.1-2024-08-07 Stable v2.1 の主な改善点は、印刷されたテキストの認識の向上、チェックボックスの検出の精度向上、読み取り順序の精度向上です。
pretrained-ocr-v2.1.1-2025-01-31 リリース候補 v2.1.1 は V2.1 と同様で、USEUasia-southeast1 を除くすべてのリージョンで利用できます。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 500
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く。
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 Enterprise Document OCR

ドキュメントからエンティティを抽出します

トレーニングに使用するラベル付きデータセットとラベルなしデータセットのサンプルについては、サンプル データセットをご覧ください。

カスタム エクストラクタ

説明

生成 AI またはカスタムモデルを使用してドキュメントからフィールドを抽出します。モデルをファインチューニングして、ドキュメントからデータを正確に抽出します。

カテゴリ 抽出
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する CUSTOM_EXTRACTION_PROCESSOR
  • 抽出に生成 AI を使用する場合は、次のようになります。

    • 公式にサポートされているのは英語のみです。
    • リージョンは、USEUnorthamerica-northeast1asia-southeast1 で利用できます。

サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力対応
アフリカーンス語 af Latn
アラビア語 ar Arab
アゼルバイジャン語 az Latn
アゼルバイジャン語(キリル文字) az-Cyrl Cyrl
ベラルーシ語 be Cyrl
ブルガリア語 bg Cyrl
ボスニア語 bs Latn
カタルーニャ語 ca Latn
セブアノ語 ceb Latn
チェコ語 cs Latn
ウェールズ語 cy Latn
デンマーク語 da Latn
ドイツ語 de Latn
ギリシャ語 el Grek
英語 en Latn
エスペラント語 eo Latn
スペイン語 es Latn
エストニア語 et Latn
バスク語 eu Latn
ペルシャ語 fa Arab
フィンランド語 fi Latn
フィリピン語 fil Latn
フランス語 fr Latn
アイルランド語 ga Latn
ガリシア語 gl Latn
ヒンディー語 hi Deva
クロアチア語 hr Latn
クレオール語(ハイチ) ht Latn
ハンガリー語 hu Latn
インドネシア語 id Latn
アイスランド語 is Latn
イタリア語 it Latn
ヘブライ語 iw Hebr
日本語 ja Jpan
ジャワ語 jv Latn
カザフ語 kk Cyrl
韓国語 ko Kore
キルギス語 ky Cyrl
ラテン語 la Latn
リトアニア語 lt Latn
ラトビア語 lv Latn
マケドニア語 mk Cyrl
モンゴル語 mn Cyrl
マラーティー語 mr Deva
マレー語 ms Latn
マルタ語 mt Latn
ネパール語 ne Deva
オランダ語 nl Latn
ノルウェー語 no Latn
ポーランド語 pl Latn
パシュト語 ps Arab
ポルトガル語(ポルトガル、ブラジル) pt Latn
ルーマニア語 ro Latn
ロシア語 ru Cyrl
ロシア語(ペトロフ正書法) ru-PETR1708 Cyrl
サンスクリット語 sa Deva
スロバキア語 sk Latn
スロベニア語 sl Latn
アルバニア語 sq Latn
セルビア語 sr Cyrl
スウェーデン語 sv Latn
スワヒリ語 sw Latn
タガログ語 tl Latn
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ウルドゥー語 ur Arab
ウズベク語 uz Latn
ウズベク語(キリル) uz-Cyrl Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
中国語(簡体) zh-Hans Hani
中国語(繁体) zh-Hant Hani
ズールー語 zu Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-foundation-model-v1.4-2025-02-05 Stable Gemini 2.0 Flash LLM を搭載したプロダクション レディの候補。チェックボックスの検出などの高度な OCR 機能も含まれます。
pretrained-foundation-model-v1.5-2025-05-05 Stable Gemini 2.5 Flash LLM を搭載した本番環境対応の候補。新しいモデルを試したい方におすすめします。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
正規化されたデータ型

詳細については、拡充と正規化データセットの作成のページをご覧ください。

正規化されたデータ型の完全なリスト
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 カスタム エクストラクタ

Form パーサー

説明

OCR テキストだけでなく、一般的な Key-Value ペア(エンティティとチェックボックス)、テーブル、汎用エンティティをドキュメントから抽出します。

このプロセッサは、高度な ML テクノロジーを適用して、200 以上の言語のドキュメントから Key-Value ペア、チェックボックス、表を抽出します。このプロセッサは、ディープ ラーニング モデルを利用して、さまざまなドキュメント タイプに共通する 11 個の汎用エンティティも抽出します。

カテゴリ 抽出
関数 OCR、フォーム解析、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する FORM_PARSER_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力対応
アフリカーンス語 af Latn
アルバニア語 sq Latn
アラビア語 ar Arab
ベラルーシ語 be Cyrl
カタルーニャ語 ca Latn
中国語 zh Hani
クロアチア語 hr Latn
チェコ語 cs Latn
デンマーク語 da Latn
オランダ語 nl Latn
英語 en Latn
エストニア語 et Latn
フィリピン語 fil Latn
フィンランド語 fi Latn
フランス語 fr Latn
ドイツ語 de Latn
ヘブライ語 iw Hebr
ヒンディー語 hi Deva
ハンガリー語 hu Latn
アイスランド語 is Latn
インドネシア語 id Latn
イタリア語 it Latn
日本語 ja Jpan
韓国語 ko Kore
ラトビア語 lv Latn
リトアニア語 lt Latn
マケドニア語 mk Cyrl
マレー語 ms Latn
マラーティー語 mr Deva
ネパール語 ne Deva
ノルウェー語 no Latn
ペルシャ語 fa Arab
ポーランド語 pl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
ルーマニア語 ro Latn
ロシア語 ru Cyrl
セルビア語 sr Cyrl
スロバキア語 sk Latn
スロベニア語 sl Latn
スペイン語 es Latn
スウェーデン語 sv Latn
タガログ語 tl Latn
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド 説明
pretrained-form-parser-v1.0-2020-09-23 Stable

なし

以前のバージョン。最高の品質と完全な機能セットを実現するには、フォーム パーサー v2.0 を使用します。
pretrained-form-parser-v2.0-2022-11-10 Stable
フィールドを表示する
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
推奨バージョン。汎用エンティティをサポートし、アップグレードされたテーブル、KVP、チェックボックス モデルと 200 以上の言語が含まれています。
pretrained-form-parser-v2.1-2023-06-26 リリース候補版

なし

パブリック プレビュー版。デジタル PDF ファイルからのネイティブ テキスト抽出が有効になっている v2.0 と同じモデル。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 100
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 Form パーサー

レイアウト パーサー

説明

ドキュメントのコンテンツ要素(テキスト、表、リスト)を抽出し、コンテキスト アウェア チャンクを作成します。

レイアウト パーサーは、テキスト、表、リストなどのドキュメント コンテンツ要素を抽出し、生成 AI や検索アプリケーションでの情報検索を容易にするコンテキスト アウェア チャンクを作成します。

カテゴリ 抽出
関数 レイアウト解析、ドキュメント チャンキング
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する LAYOUT_PARSER_PROCESSOR
  • このパーサーは、PDF、HTML、DOCX ファイルをサポートしています。
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力対応
アフリカーンス語 af Latn
アルバニア語 sq Latn
アラビア語 ar Arab
アルメニア語 hy Armn
ベラルーシ語 be Cyrl
ベンガル語 bn Beng
ベンガル語 bn Beng
ブルガリア語 bg Cyrl
カタルーニャ語 ca Latn
中国語 zh Hani
クロアチア語 hr Latn
チェコ語 cs Latn
デンマーク語 da Latn
オランダ語 nl Latn
英語 en Latn
エストニア語 et Latn
フィリピン語 fil Latn
フィンランド語 fi Latn
フランス語 fr Latn
ドイツ語 de Latn
ギリシャ語 el Grek
グジャラート語 gu Gujr
ヘブライ語 iw Hebr
ヒンディー語 hi Deva
ハンガリー語 hu Latn
アイスランド語 is Latn
インドネシア語 id Latn
イタリア語 it Latn
日本語 ja Jpan
カンナダ語 kn Knda
クメール語 km Khmr
韓国語 ko Kore
ラオ語 lo Laoo
ラトビア語 lv Latn
リトアニア語 lt Latn
マケドニア語 mk Cyrl
マレー語 ms Latn
マラヤーラム語 ml Mlym
マラーティー語 mr Deva
ネパール語 ne Deva
ノルウェー語 no Latn
ペルシャ語 fa Arab
ポーランド語 pl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
パンジャブ語 pa Guru
ルーマニア語 ro Latn
ロシア語 ru Cyrl
セルビア語 sr Cyrl
スロバキア語 sk Latn
スロベニア語 sl Latn
スペイン語 es Latn
スウェーデン語 sv Latn
タガログ語 tl Latn
タミル語 ta Taml
テルグ語 te Telu
タイ語 th Thai
トルコ語 tr Latn
ウクライナ語 uk Cyrl
ベトナム語 vi Latn
イディッシュ語 yi Hebr
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-layout-parser-v1.0-2024-06-03 Stable 推奨バージョン。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 500
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • eu
  • us
詳細 レイアウト パーサー

事前トレーニング済みプロセッサを確認する

銀行明細書パーサー

説明

名前、口座、取引などの情報を銀行の明細書から抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する BANK_STATEMENT_PROCESSOR
  • 複数ページの入力ファイルのページが正しいドキュメント タイプで、サポートされているバージョンのいずれかである場合、プロセッサはサポートされている最初のドキュメントに対してエンティティ抽出を実行します。入力ファイルに該当するドキュメントが見つからない場合、プロセッサはエラー メッセージを返します。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-bankstatement-v1.0-2021-08-08 Stable
pretrained-bankstatement-v1.1-2021-08-13 Stable
pretrained-bankstatement-v2.0-2021-12-10 Stable
pretrained-bankstatement-v3.0-2022-05-16 Stable このバージョンでは、入力ファイルに 1 つの銀行取引明細書が含まれていることを前提としています。デフォルト バージョンとは異なり、このバージョンでは銀行取引明細書の入力ファイルがチェックされず、銀行取引明細書が見つからなくてもエラーは返されません。
pretrained-bankstatement-v4.0-2023-07-31 リリース候補版
pretrained-bankstatement-v5.0-2023-12-06 リリース候補版

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 30
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの完全なリスト
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
拡充されたフィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの全リスト
  • bank_address
  • bank_name
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
ラベル付けの手順 新しいウィンドウで開く
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • eu
  • us

W2 パーサー

説明

Form W2 から従業員、雇用主、賃金などを抽出

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する FORM_W2_PROCESSOR
  • 複数ページの入力ファイルのページが正しいドキュメント タイプで、サポートされているバージョンのいずれかである場合、プロセッサはサポートされている最初のドキュメントに対してエンティティ抽出を実行します。入力ファイルに該当するドキュメントが見つからない場合、プロセッサはエラー メッセージを返します。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
サポートされているフォーム/バージョン
  • 2020(標準バージョンとカスタマイズ バージョン)
  • 2019(標準バージョンとカスタマイズ バージョン)
  • 2018(標準バージョンとカスタマイズ バージョン)
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド 説明
pretrained-w2-v1.0-2020-10-01 Stable

なし

pretrained-w2-v1.1-2022-01-27 Stable

なし

pretrained-w2-v1.2-2022-01-28 Stable
フィールドを表示する
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

品質の改善と新しいフィールドのサポート。スプリッタは含まれません。

pretrained-w2-v2.0-2022-03-30 リリース候補版
フィールドを表示する
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

品質の改善、ボックス 12 のフィールドのサポート、EmployeeNameEmployeeAddressEmployerNameAndAddress のきめ細かい予測。これらはすべて出力の一部ではなくなり、追加のフィールドに置き換えられます。

pretrained-w2-v2.1-2022-06-08 Stable
フィールドを表示する
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

バージョン pretrained-w2-v2.0-2022-03-30 と同様に、品質がさらに向上し、エンティティ EmployeeName_Suffix が追加されています。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 15
最大ページ数(画像なしモードのオンライン/同期リクエスト): 15
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの完全なリスト
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
拡充されたフィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの全リスト
  • EmployerNameAndAddress
  • EIN
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • eu
  • us

米国パスポート パーサー

説明

名前、ドキュメント ID、生年月日などのフィールドを抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する US_PASSPORT_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-us-passport-v1.0-2021-06-14 Stable

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最大ページ数(画像なしモードのオンライン/同期リクエスト): 2
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの完全なリスト
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • eu
  • us

光熱費パーサー

説明

公共料金の請求書からテキストと値(サプライヤー名や過去の支払額など)を抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 制限付き [*]
API を入力する UTILITY_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-utility-v1.1-2021-04-09 Stable
pretrained-utility-v1.2-2022-12-15 リリース候補版

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 10
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの完全なリスト
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
ラベル付けの手順 新しいウィンドウで開く。
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • eu
  • us

身分証明書パーサー

説明

複数のシグナルを使用して身分証明書の有効性を予測します。

Identity Document Proofing Processor は、次の 4 つのシグナルを使用して身分証明書の有効性を予測できるように設計されています。

現在、プロセッサは次のシグナルから情報を返します。

  • fraud_signals_is_identity_document 検出: 画像に認識済みの身分証明書が含まれているかどうかを予測します。
  • fraud_signals_suspicious_words 検出: 身分証明書では一般的に使われない単語が存在するかどうかを予測します。
  • fraud_signals_image_manipulation 検出: 画像編集ツールで画像が変更または改ざんされたかどうかを予測します。
  • fraud_signals_online_duplicate 検出: 画像がオンラインで見つかるかどうかを予測します(米国のみ)。

カテゴリ トレーニング済み
関数 OCR、品質分析
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する ID_PROOFING_PROCESSOR
  • 現在、オンライン重複検出機能は米国のデータセンターで処理されています。この機能のリージョンとマルチリージョンのサポートは、米国以外では利用できません。
  • このプロセッサは、新しいプロセッサ バージョンのリリースよりも頻繁に更新されるアルゴリズムによってサポートされています。そのため、同じプロセッサ バージョンを使用している場合でも、プロセッサから返される出力が時間とともに変化することがあります。たとえば、オンライン重複検出システムは、ウェブ上に存在する画像をモニタリングします。そのため、プロセッサのバージョンで追跡できるよりも速く、システムの動作が変化する可能性があります。
  • 責任ある AI[†] と人間のレビュー[‡]に関する注意事項を参照してください。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
サポートされているフォーム/バージョン
  • 米国のパスポート、パスカード、運転免許証のサポート。
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド 説明
pretrained-id-proofing-v1.0-2022-10-03 Stable

なし

pretrained-id-proofing-v1.1-2023-05-18 リリース候補版
フィールドを表示する
  • fraud_signals_photocopy_detection

コピー検出シグナルの追加

pretrained-id-proofing-v1.2-2023-10-04 リリース候補版
フィールドを表示する
  • fraud_signals_photocopy_detection

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最大ページ数(画像なしモードのオンライン/同期リクエスト): 2
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの完全なリスト
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く。
サポートされているリージョン
  • eu
  • us

支払い明細パーサー

説明

支払い明細から名前、ビジネス、金額などを抽出します

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する PAYSTUB_PROCESSOR
  • 複数ページの入力ドキュメントに有効な給与明細が複数含まれている場合、プロセッサは最初の有効な給与明細からのみエンティティを抽出します。入力ファイルに給与明細が見つからない場合、プロセッサはエラー メッセージを返します。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド 説明
pretrained-paystub-v1.0-2021-03-19 Stable

なし

pretrained-paystub-v1.1-2021-08-13 Stable
フィールドを表示する
  • net_pay
  • net_pay_ytd
  • employee_account_number
品質の改善と新しいフィールドのサポート。
pretrained-paystub-v1.2-2021-12-10 Stable

なし

pretrained-paystub-v2.0-2022-05-17 リリース候補版
フィールドを表示する
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

このバージョンでは、入力ファイルに 1 つの給与明細が含まれていることを前提としています。デフォルト バージョンとは異なり、このバージョンでは入力ファイルで給与明細がチェックされず、給与明細が見つからなくてもエラーは返されません。

品質の向上、新しいフィールドのサポート、新しいスキーマ。ボーナス、コミッション、休日、残業、基本給、有給休暇が earning_item/earning_this_period に含まれるようになり、年初来のバージョンは earning_item/earning_ytd に含まれるようになりました。Direct Deposit と Employee Account Number が direct_deposit_item の下にネストされるようになりました。

非同期ページの上限は 10 です。

pretrained-paystub-v2.0-2022-07-22 Stable

なし

品質の向上とアップトレーニングの強化。

pretrained-paystub-v3.0-2023-12-06 リリース候補版

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 50
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの全リスト
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
拡充されたフィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの全リスト
  • employer_address
  • employer_name
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
ラベル付けの手順 新しいウィンドウで開く
サポートされているリージョン
  • eu
  • us

米国運転免許証パーサー

説明

名前、ドキュメント ID、生年月日などのフィールドを抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する US_DRIVER_LICENSE_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
サポートされているフォーム/バージョン
  • 50 州すべてとワシントン DC をサポート。
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-us-driver-license-v1.0-2021-06-14 Stable

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 2
最大ページ数(バッチ/オフライン/非同期リクエスト): 2
最大ページ数(画像なしモードのオンライン/同期リクエスト): 2
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの全リスト
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • eu
  • us

経費パーサー

説明

費用の発生日、サプライヤー名、合計金額、通貨など、費用に関するドキュメントからテキストと値を抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する EXPENSE_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力対応
ドイツ語 de Latn
英語 en Latn
スペイン語 es Latn
フランス語 fr Latn
日本語 ja Jpan
オランダ語 nl Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 検出された追加フィールド サポートされる言語の追加 説明
pretrained-expense-v1.1-2021-04-09 Stable

なし

なし

2021 年 4 月にリリースされました。
pretrained-expense-v1.3.2-2024-09-11 リリース候補版
フィールドを表示する
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: 日本語
基盤となるビジョンモデルが強化された v1.3 へのアップグレード。
pretrained-expense-v1.4-2022-11-18 リリース候補版
フィールドを表示する
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 日本語
  • it: イタリア語
  • pt: ポルトガル語(ポルトガル、ブラジル)
パフォーマンスの改善とアップトレーニングのサポート。最大ページ数(オンライン/同期リクエスト)の上限が 15 に引き上げられました。
pretrained-expense-v1.4.2-2024-09-12 リリース候補版
フィールドを表示する
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: 日本語
  • it: イタリア語
  • pt: ポルトガル語(ポルトガル、ブラジル)
基盤となるビジョン モデルが強化された v1.4 へのアップグレード。

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 10
最大ページ数(バッチ/オフライン/非同期リクエスト): 10
最大ページ数(画像なしモードのオンライン/同期リクエスト): 10
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの完全なリスト
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
拡充されたフィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの全リスト
  • supplier_address
  • supplier_name
  • supplier_phone
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
ラベル付けの手順 新しいウィンドウで開く
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Invoice パーサー

説明

請求書からテキストと値(請求書番号、サプライヤー名、請求額、税額、請求書の日付、期限など)を抽出します。

請求書パーサーは、請求書番号、サプライヤー名、請求額、税額、請求日、期限日、各項目の費用など、ヘッダーと項目フィールドの両方を抽出します。

カテゴリ トレーニング済み
関数 OCR、エンティティ抽出
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する INVOICE_PROCESSOR
サポートされている言語
言語の完全なリスト
言語名 BCP 47 タグ スクリプト 手書き入力対応
ドイツ語 de Latn
英語 en Latn
スペイン語 es Latn
エストニア語 et Latn
フランス語 fr Latn
イタリア語 it Latn
ラトビア語 lv Latn
リトアニア語 lt Latn
オランダ語 nl Latn
ポルトガル語(ポルトガル、ブラジル) pt Latn
ルーマニア語 ro Latn
スウェーデン語 sv Latn
プロセッサのバージョン
バージョン ID リリース チャンネル サポートされる言語の追加 説明
pretrained-invoice-v1.1-2021-04-09 Stable

なし

pretrained-invoice-v1.2-2022-02-18 Stable

なし

まもなく非推奨になる予定です。
pretrained-invoice-v1.3-2022-07-15 Stable
  • it: イタリア語
  • pt: ポルトガル語(ポルトガル、ブラジル)
  • ro: ルーマニア語
  • sv: スウェーデン語
  • et: エストニア語
  • lv: ラトビア語
  • lt: リトアニア語
アップトレーニング可能なプロセッサ バージョン。最大ページ数(オンライン/同期リクエスト)が 15 に増加しました。
pretrained-invoice-v1.4-2022-10-21 リリース候補版

なし

アップトレーニング可能なプロセッサ バージョン。最大ページ数(オンライン/同期リクエスト)が 15 に増加しました。
pretrained-invoice-v1.5-2023-09-15 リリース候補版

なし

pretrained-invoice-v2.0-2023-12-06 リリース候補版

なし

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
最も古いバージョンで検出されたフィールド

この情報は、[検出されたフィールド] ページでも確認できます。

フィールドの完全なリスト
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
拡充されたフィールド

詳細については、拡充と正規化のページをご覧ください。

拡充されたフィールドの全リスト
  • supplier_address
  • supplier_name
  • supplier_phone
正規化されたフィールド

詳細については、拡充と正規化のページをご覧ください。

正規化されたフィールドの完全なリスト
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
ラベル付けの手順 新しいウィンドウで開く。
入力ファイルの例 新しいウィンドウで開く。
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

ドキュメントを分類する

カスタム分類器

説明

一連のクラスからドキュメント タイプを分類するようにモデルをトレーニングします。

カテゴリ 分類
関数 OCR、分類
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する CUSTOM_CLASSIFICATION_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 200
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 カスタム分類プロセッサを作成する

カスタム スプリッター

説明

複数のドキュメントを含むファイルを個別の分類されたドキュメントに分割するモデルをトレーニングします。

カテゴリ 分類
関数 OCR、分類、分割
リリース ステージ 一般提供
アクセス ステータス 公開
API を入力する CUSTOM_SPLITTING_PROCESSOR
  • i18n はカスタム トレーニング オプションでのみサポートできます。
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 1000
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
詳細 カスタム スプリッター プロセッサを作成する

ドキュメントを要約する

Summarizer

説明

短いドキュメントと長いドキュメントの概要や箇条書きの要約を取得できます。

カテゴリ 事前トレーニング済み
関数 要約
リリース ステージ プレビュー
アクセス ステータス 公開
API を入力する SUMMARY_PROCESSOR
サポートされている言語
言語名 BCP 47 タグ スクリプト 手書き入力対応
英語 en Latn
プロセッサのバージョン
バージョン ID リリース チャンネル 説明
pretrained-foundation-model-v1.0-2023-08-22 Stable Google の基盤モデル

詳細については、プロセッサ バージョンの管理をご覧ください。

割り当てと上限
最大ページ数(オンライン/同期リクエスト): 15
最大ページ数(バッチ/オフライン/非同期リクエスト): 250
最大ページ数(画像なしモードのオンライン/同期リクエスト): 30
Uptraining
入力ファイルの例 新しいウィンドウで開く
出力例: 新しいウィンドウで開く
サポートされているリージョン
  • us
詳細 カスタム要約ツール

脚注

[*] このプロセッサは、一部のお客様にのみアクセスが制限されています。

API アクセスをリクエストするには、Document AI の制限付きアクセスお客様リクエスト フォームに必要事項を記入してお送りください。このフォームには、お客様、お客様が所属している会社、用途に関する情報を入力する必要があります。なお、アクセスには Google Cloud プロジェクト ID が必要になります。新しい Google Cloud プロジェクトを作成するか、既存のプロジェクトのプロジェクト ID を確認する場合は、こちらの手順をご覧ください。

フォームを送信すると、Document AI チームがお客様のリクエストを審査し、お客様がアクセス基準を満たしているかどうか確認いたします。アクセスが承認されると、この機能のアクセス方法と使用方法を説明するメールが届きます。

[†] 身分証明書確認は、入力画像が本物の身分証明書を表しているかどうかを判断するのに役立つ情報を身分証明書から抽出して評価します。

Google Cloudでは、お客様が AI ソリューションを安全に開発、実装できるよう支援することを重視しており、ID 確認は Google の AI に関する原則に沿って開発されています。

Google の AI に関する原則と現在のプロダクト設計に基づき、以下の用途で身分証明書確認を使用する際は、慎重に検討し、潜在的なメリットとリスクを注意深く評価することを強くおすすめします。

  • 人権に影響を与える可能性のある予測について、人間が関与しない意思決定。
  • 雇用、公共サービスへのアクセス、医療、安全が重要なコンテキストなどの機密性の高いドメイン。

[‡] 常に、より広範な身元確認プロセスとワークフローの一部として身元確認を使用します。予測されたシグナルが正確かどうかを確認するために、ワークフローに人間による審査担当者を配置することが重要です。ID 確認プロセッサは、ワークフローで ID の人間による審査に代わるものではなく、ID 書類の検証で人間による審査を支援することを目的としています。身分証明書が有効かどうかを判断する自動化された意思決定ツールとして、身元確認プロセッサを使用しないでください。人間による審査により、ドキュメントの処理精度を高めることができます。また、人間による審査用の専用ツールを使用することで、予測の評価も行えます。

このテクノロジーを実装する地域の規制を確認し、既存の業界ガイダンスを調査して、ポリシー ガイドラインと公平性に関する一般的な問題を把握してください。トレーニング用データセットのバイアス軽減、パフォーマンスの不均衡に関するカスタムモデルの評価、カスタムモデルを利用する際に検討すべき事項など、ML の公平性について説明します。

お客様には、身元確認を実装する際に、公平性、解釈可能性、プライバシー、セキュリティのベスト プラクティスを念頭に置くことをおすすめします。責任ある AI の実装方法については、Google の責任ある AI への取り組みに関する推奨事項をご覧ください。

ユースケースとサンプル アプリケーション コード リポジトリの詳細については、ブログ投稿 Document AI で身分証明書の処理を自動化するをご覧ください。