본문 바로가기
  • 노션에서 삽질한 내용을 정리하는 블로그
자기발전소/# Machine Learning

OCR(Optical Character Recognition) 실습

by iamlucia 2020. 12. 24.

OCR (Optical Character Recognition) 


OCR이 활용되는 사례:

물류택배업에서 활발히 사용

운전 마일리지 (대쉬보드 찍어서 얼마나 탔는지 확인)

자동차 번호판 인식

명함 및 카드 인식

영수증 인식

 

OCR 서비스 활용 실습


 

사용 TOOL : Google Colab
사전에 필요한 것 : 
Azure Computer Vision API 서비스를 사용해야 하기 때문에 API 사용에 필요한 Key 및 Endpoint

 


1. 글자 인식 위한 패키지 설치

 - requests: 네트워크 통신 목적

 

 

 

2. 서비스 키 및 엔드포인트 선언 

 - 서비스를 사용할 수 있도록 Azure Cognitive Service API 키 및 엔드포인트 변수 선언

 - 그중 OCR 서비스를 활용할 수 있게 URL 변수 추가 선언

 

 

 

3. 이미지 불러오기

 - 인식할 글자가 있는 이미지 불러오기 

 

불러온 이미지 확인

 

 

4. API 호출 

 - 헤더 및 파라미터, 요청 데이터(이미지URL)

 - requests 의 post 메서드 활용하여 요청 전송 

 - 응답 결과 확인 및 json 형태 변환

 

 

json으로 변환된 응답 결과

 

 

5. 이미지 속 글자 분석 

 - 이미지 분석한 결과 analysis에서 words 인덱스에 해당하는 리스트 부분 추출

 

 

6. 이미지에 글자 입력

 - 분석한 결과(word_infos라는 리스트에 들어있는)를

가공하여 이미지 글자 위에 인식된 글자를 TEXT FONT로 표기