자기발전소/# Machine Learning
OCR(Optical Character Recognition) 실습
iamlucia
2020. 12. 24. 18:22
OCR (Optical Character Recognition)
OCR이 활용되는 사례:
물류택배업에서 활발히 사용
운전 마일리지 (대쉬보드 찍어서 얼마나 탔는지 확인)
자동차 번호판 인식
명함 및 카드 인식
영수증 인식
OCR 서비스 활용 실습
사용 TOOL : Google Colab
사전에 필요한 것 :
Azure Computer Vision API 서비스를 사용해야 하기 때문에 API 사용에 필요한 Key 및 Endpoint
1. 글자 인식 위한 패키지 설치
- requests: 네트워크 통신 목적
2. 서비스 키 및 엔드포인트 선언
- 서비스를 사용할 수 있도록 Azure Cognitive Service API 키 및 엔드포인트 변수 선언
- 그중 OCR 서비스를 활용할 수 있게 URL 변수 추가 선언
3. 이미지 불러오기
- 인식할 글자가 있는 이미지 불러오기
4. API 호출
- 헤더 및 파라미터, 요청 데이터(이미지URL)
- requests 의 post 메서드 활용하여 요청 전송
- 응답 결과 확인 및 json 형태 변환
5. 이미지 속 글자 분석
- 이미지 분석한 결과 analysis에서 words 인덱스에 해당하는 리스트 부분 추출
6. 이미지에 글자 입력
- 분석한 결과(word_infos라는 리스트에 들어있는)를
가공하여 이미지 글자 위에 인식된 글자를 TEXT FONT로 표기