請求書を解析する

Document AI を活用した Invoice パーサー プラグインを使用して、Cloud Data Fusion で請求書を構造化データに変換できます。構造化データは BigQuery に保存されます。

始める前に

請求書を解析するには、バージョン 6.4.1 以降で実行されている Cloud Data Fusion インスタンスが必要です。詳細については、Cloud Data Fusion インスタンスのアップグレードをご覧ください。

プロセッサの作成

  1. Google Cloud コンソールで、Document AI プロセッサのページに移動します。

    [プロセッサ] に移動

  2. プロセッサを作成します。プロセッサのタイプには、Invoice パーサーを選択します。

    プロセッサ タイプには、Invoice を選択します

Invoice パーサー プラグインを構成する

  1. Google Cloud コンソールで、Cloud Data Fusion の [Instances] ページに移動します。

    [インスタンス] に移動

  2. 目的のインスタンスがバージョン 6.4.1 以降にアップグレードされていることを確認します。以前のバージョンの場合は、インスタンスをアップグレードします。

  3. [インスタンスの表示] をクリックします。 Cloud Data Fusion UI が開きます。

  4. [Hub] をクリックします。

  5. [GCP] をクリックし、[GCP Plugins] をデプロイします。

  6. [DocAI] をクリックし、[Doc AI Plugin] をデプロイします。

  7. Invoice パーサー クイックスタート > [Create] をクリックします。

  8. Invoice パーサー プロセッサ ID、Cloud Storage バケットパス、BigQuery テーブルの詳細を入力して、パイプラインをカスタマイズします。

  9. パイプラインをデプロイして実行する

    Invoice Parser プラグインを使用したパイプラインの例

解析された請求書は BigQuery の出力テーブルに保存されます。請求書のメタデータは Metadata テーブルに保存され、解析ステータス、Cloud Storage パス、未加工の請求書のアップロード タイムスタンプが含まれます。出力テーブルとメタデータ テーブルのレコードは、invoice_uuid キーを使用して結合できます。