텍스트 인식

텍스트 감지는 동영상 또는 동영상 세그먼트에 있는 프레임에서 시각적 텍스트를 감지하기 위해 광학 문자 인식(OCR)을 수행하고, 동영상에서 해당 텍스트의 프레임 수준 위치 및 타임스탬프에 대한 정보와 함께 감지된 텍스트를 반환합니다.

텍스트 감지는 특히 프로그램 및 영화 끝에 나오는 엔딩 크레딧 목록을 감지 및 추출하거나 번인된 자막의 존재 유무를 감지하는 등의 미디어 및 엔터테인먼트 사용 사례에 유용합니다.

텍스트 감지는 Cloud Vision API에서 지원하는 언어에 사용할 수 있습니다.

동영상 또는 동영상 세그먼트에서 시각적 텍스트를 감지하려면 annotate 메서드를 호출하고 TEXT_DETECTIONfeatures 필드에 지정합니다.

Video Intelligence API 시각화에서 이 기능의 사용 사례를 참조하세요.

텍스트 감지 요청 및 주석 작성된 결과 가져오기에 대한 예시는 텍스트 감지를 참조하세요.