OCR(Optical Character Recognition) 실습

iamlucia 2020. 12. 24. 18:22

OCR (Optical Character Recognition)

OCR이 활용되는 사례:

물류택배업에서 활발히 사용

운전 마일리지 (대쉬보드 찍어서 얼마나 탔는지 확인)

자동차 번호판 인식

명함 및 카드 인식

영수증 인식

사용 TOOL : Google Colab
사전에 필요한 것 :
Azure Computer Vision API 서비스를 사용해야 하기 때문에 API 사용에 필요한 Key 및 Endpoint

1. 글자 인식 위한 패키지 설치

- requests: 네트워크 통신 목적

2. 서비스 키 및 엔드포인트 선언

- 서비스를 사용할 수 있도록 Azure Cognitive Service API 키 및 엔드포인트 변수 선언

- 그중 OCR 서비스를 활용할 수 있게 URL 변수 추가 선언

3. 이미지 불러오기

- 인식할 글자가 있는 이미지 불러오기

4. API 호출

- 헤더 및 파라미터, 요청 데이터(이미지URL)

- requests 의 post 메서드 활용하여 요청 전송

- 응답 결과 확인 및 json 형태 변환

5. 이미지 속 글자 분석

- 이미지 분석한 결과 analysis에서 words 인덱스에 해당하는 리스트 부분 추출

6. 이미지에 글자 입력

- 분석한 결과(word_infos라는 리스트에 들어있는)를

가공하여 이미지 글자 위에 인식된 글자를 TEXT FONT로 표기