아래는 실제 데이터 추출 사례를 나열합니다.
아래는 실제 데이터 추출 사례를 나열합니다.
보정전 (53-뒤에 빨간색으로 표시된 2자가 2번 OCR엔지에서 오류 처리됨)
41590223615322911964 | 41590-2-23-61-53-229119-6 (20) |
보정후
4159022361532911964 | 41590-2-23-61-53-291196-4 (19) |
실제 이미지 파일
보정전
보정후 - 보정없음
5번째 숫자 0이 의심스러운 상황을 표시함
실제 이미지 점검결과 2중 인쇄된 곳의 숫자를 0이 아닌 6으로 읽은 경우
2-30 으로 적힌 곳은 2-23 이 일반적임, 왜냐하면 23은 2023년도를 뜻하는 자리로 사용되기 때문임.
실제 고지서 확인결과 2-30으로 기록됨. 이건 재확인이 필요함
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
» |
HappyOCR의 데이터 보정기능
5 ![]() |
capegoat | 2023.10.02 | 64 |
4 |
지방세입계좌(전자납부번호) 구성내용
![]() |
capegoat | 2023.09.25 | 60 |
3 | 전자납부번호의 체크 디짓 검증 방법은?(답변은 chat-gpt 3.5) 1 | capegoat | 2023.09.25 | 49 |
2 |
전자납부번호 19자리 체계
![]() |
capegoat | 2023.09.25 | 46 |
1 |
전국 렌터가 회사(6천개)의 렌터가 보유댓수 등
1 ![]() |
capegoat | 2023.09.10 | 44 |
(가칭)해피OCR
비정형 템플릿 OCR 전문회사(자동차 범칙금, 의료비 영수증 등)
06672. 서울특별시 서초구 방배로
reitonprof@gmail.com
이메일로 연락해 주세요.
전자납부번호를 OCR엔진에서 잘 못 읽는 경우
(전자납부번호는 숫자 19자리로 이루어진 댓쉬(하이픈)과 같은 패턴을 사용하고 있지 않음, 따라서 OCR엔진에서 오류판독이 많은 사례임)
또한, 단순 숫자로만 이루어져 있기 때문에, 과태료 OCR장표 특성상 연속된 숫자가 많은 것이 특징임. 따라서 추출도 쉽지 않음
더욱, 정확성 판별을 위한 체크 디짓과 같은 정보가 없어서(체크 디짓 정보가 있다고 하더라도, 발행기관이 다수라서, 현실적으로 체크하기 어려움) 정합성 판별도 어려운 상태임
OCR 데이터 추출(보정전)
OCR 데이터 추출(보정후) - 불필요한 숫자 2 삭제 후 확정된 전자납부번호
해당 이미지