Document AI는 Enterprise Knowledge Graph를 사용하여 항목 추출 결과 (지원되는 필드의 경우)를 정규화하고 보강합니다. 예를 들어 123 Main St Apt 1
및 123 Main street # 1
주소는 동일한 표준화된 주소로 정규화될 수 있습니다.
지원되는 각 필드의 경우 Document AI는 원시 추출된 필드 외에도 normalizedValue
를 반환하여 리터럴 텍스트를 정규화합니다.
여기에는 후처리를 줄이기 위해 표준화된 형식의 데이터가 포함됩니다.
대부분의 데이터는 다음 카테고리 중 하나에 속합니다.
- 금액
- 날짜
- 타임스탬프
- 주소
- 불리언
- 정수
- 부동 소수점 수
샘플 응답
강화된 값은 다음 잘린 샘플에 표시된 대로 entities.normalizedValue
필드에서 확인할 수 있습니다.
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
샘플에서 원래 employer_name
'Google Singapore'가 'Google Asia Pacific, Singapore'로 정규화되었습니다.
Google Cloud 콘솔에서 보강되고 정규화된 필드는 G로 주석이 달려 있습니다. 예를 들면 다음과 같습니다.

지원되는 프로세서
다음은 엔티티 강화를 지원하는 프로세서와 필드입니다.
프로세서 | 정보가 추가된 필드 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
은행 명세서 파서
|
|
||||||||||||
W2 파서
|
|
||||||||||||
급여 명세서 파서
|
|
||||||||||||
지출 파서
|
|
||||||||||||
인보이스 파서
|
|