조회 수 34 추천 수 0 댓글 0

userDB는 총 63개의 헤더를 가지고 있음

 

그룹1    OCR작업용    분홍색    (헤더갯수 : 2개)

OCR헤더 이곳에서 정해진 순서로 OCR쉬트에 헤더를 생산한다
단, 일부 헤더의 데이터는 선행 데이터를 기반으로 하는 경우에는 오류가 발생할 수 있다.
헤더 넓이는 칼럼 넓이이다.
헤더넓이

 

그룹2    보고서 업체별 작성용    노란색    (헤더갯수 : 2개)

하나캐피탈헤더 이 헤더는 어레이 구성임(OCR헤더|별명헤더|칼럼넓이)
OCR헤더에서 데이터를 가져오며, 별명헤더로 헤더이름을 바꿔주고, 칼럼넓이는 보고서 작성시 칼럼의 크기를 조정한다
농협캐피탈헤더

 

그룹3    수신인(업체명)    연녹색    (헤더갯수 : 4개)

수신인 수신인은 색인(index)로 사용되는 항목(item)이며, 수신인 별명은 OCR쉬트에 보여주는 수신인 이름이다.
하나캐피탈소유차량에 번호가 등록되면, 수신인_별명이 하나캐피탈인 경우 차량번호를 검증한다.(없는 경우는 일반로직으로 검증- 2023.10.20 현재 일반로직은 반영안됨)
하나캐피탈업무용에 등록된 차량번호는 별도로 표시한다(2023.10.20 현재 반영안됨)
만약, 다른 회사용 차량을 검증하고 싶을때, 이 칼럼 뒤에 삽입후 module에서 수정해야 한다.
수신인_별명
하나캐피탈소유차량
하나캐피탈업무용


그룹4    장표종류    하늘색    (헤더갯수 : 2개)

장표종류 장표종류는 본 프로그램 목적상 임의로 부여된 항목이다.
(실제 장표종류 구분하기 위함이 아니다) 장표에서 유니크한 항목을 구분하기 위해서 만들어졌으며, 데이터 추출하기 어려운 항목에서 사용된다(주로 블럭데이터 추출 등)
장표종류_별명

 

그룹5    전자납부번호    진갈색    (헤더갯수 : 2개)

전자납부번호 전자납부번호 검증(validation)을 위해서 만들어진 항목으로 자세한 설명은 전자납부번호를 참고할것
전자납부번호패턴

 

그룹6    전자납부번호 기관코드    진청색    (헤더갯수 : 2개)

그룹7    전자납부번호 위반코드    분홍색    (헤더갯수 : 2개)

그룹8    전자납부번호 과세코드    연녹색    (헤더갯수 : 1개)

전자납부_기관코드 위 항목은 출처가 없이 데이터에서 추출한 자료임
따라서 위반코드, 과세코드라는 명칭도 임의로 부여된자료임
전자납부_기관코드_별명
전자납부_위반코드
전자납부_위반유형
전자납부_과세코드

 

그룹9    날짜데이터    노란색    (헤더갯수 : 6개)

group_no group_no는 사실상 불핃요한 항목임
날짜데이터는 패턴 매이커를 이용해서 만들면 됩니다.
Datevalue와 Timevalue는 길이(length)를 의미하며 좌우공백은 길이에서 사용하지 않음
납기내기한과 납기후기한은 인덱스항목임(패턴인덱스, 참고로 item인덱스항목과 사용법이 다름)
날짜데이터
DateValue
TimeValue
납기내기한
납기후기한

 

그룹10    시간데이터 패턴    회색    (헤더갯수 : 2개)

시간_패턴 날짜데이터 항목중 시간만 분리해서 데이터를 추출하는 부분임
OCR쉬트에서는 사용하지 않음, 단순히 날짜데이터와 시간데이터가 다른 셀에 위치하는 경우에 합치기 위해서 만든 항목임
Time_len

 

그룹11    수신인주소    흰색    (헤더갯수 : 1개)

수신인주소 현재 사용하지 않는 항목임(임시)

 

그룹12    사고일시    하늘색    (헤더갯수 : 2개)

사고일시 에레이 구분자&뒤에 있는 구분자는 배제조건임(예, 위반&정차는 위반은 true, 정차는 false를 동시에 만족해야 함)
위반내용중사고일시배제 항목은 위반내용에 item이 있으면 사고일시를 추출하지 못해도 ok를 나타냄(2023.10.20 현재 이 용도 불확실한 상태임)
위반내용중사고일시배제

 

그룹13    금액데이터    오렌지    (헤더갯수 : 3개)

금액데이터_패턴 금액을 추출하기 위한 패턴으로사용되며, 패턴에 들어있는 숫자 이외의 문자는 추출용으로만 사용되고 데이터에서 버림
납기내금액과 납기후금액은 인덱스 item으로 사용되며, 금액중 OCR장표에 OCR용 캐릭터금액패턴(\s\+(\d+)\d{1}<\s)이 최우선순위를 갖고 있음
납기내금액
납기후금액

 

그룹14    위반장소    진파랑    (헤더갯수 : 4개)

위반장소 위반장소 문장단위가 검색의 기본임, 어레이는 &는 구분자임
구분자 가 왼쪽에block이 표시되면 블락단위로 검색함(x,y좌표중 y위주로 검색) 구분자 앞에 left는 문장을 왼쪽에서 검색함
위반장소_제외글자는 item으로 사용되며 해당 문자부터 오른쪽에 있는 문자 전부를 삭제함(2023.10.20 최초조건만족시 종료 로직이나, 계속 루핑하는 로직으로 변경하는 것을 고려중임)
위반장소_패턴도 어레이를 사용하며,  from추출문자to문자 패턴임
발행기관별_위반장소도 어레이 패턴이며, 구분자는 &이고, 발행기관에 따라 위반장소가 정해지는 항목임(조심해서 사용할 것, 민자터널과 같이 발행기관이름이 1개의 위반항목이 있는 경우에만 사용할 것)
위반장소_제외글자
위반장소_패턴
발행기관별_위반장소

 

그룹15    위반건수    회색    (헤더갯수 : 1개)

위반건수 위반건수 추출을 위해서 만들었으나, 2023.10.20현재 로직으로 추출하며, userDB에서는 사용하고 있지 않음

 

그룹16    위반유형 코드    흰색    (헤더갯수 : 3개)

위반내용_별명_인덱스 하나캐피탈용 보고서 작성시 사용하는 코드로 위반유형(별명)에 매치시켜서 사용하는 단순 코드임
위반유형
통보유형

 

그룹17    위반내용    녹색    (헤더갯수 : 4개)

위반내용 위반내용은 인덱스용 item이며, 별명은 보고서용 명칭임
위반유형_코드와 통보유형_코드를 여기서 직접 보고서 작성할때 사용하려고 만들었으나, 보고서작성회사별로 상이할 수 있어서 사용을 보류함
위반내용_별명
위반유형_코드
통보유형_코드

 

그룹18    통행료차수    흰색    (헤더갯수 : 1개)

통행료차수 단순 인덱스용 item임

 

그룹19    차량번호    노란색    (헤더갯수 : 2개)

차량번호 차량번호는 2023.10.20현재 패턴을 사용중이기 때문에 1차 검색에서는 사용하지 않으나, 3차 검색에서 사용함
차량번호_패턴은 2023.10.20현재 사용하고 있지 않음
차량번호_패턴

 

그룹20    부가, 최장    흰색    (헤더갯수 : 1개)

부가최장 부가통행료와 최장통행료를 추출하기 위해 예비용으로 만든 항목임(2023.10.20 현재 사용하지 않고 로직에서 구현함)

 

그룹21    은행 코드 추출용    파랑    (헤더갯수 : 3개)

은행_인덱스 하나캐피탈용 보고서 작성시 사용하는 코드임, 은행_인덱스의 길이(렝쓰)는 2자리 고정임
은행_풀네임
은행코드

 

그룹22    복수은행 패턴 추출용    회색    (헤더갯수 : 1개)

복수은행_패턴 Text라인에 복수의 은행 및 계좌번호가 나오는 경우, 패턴으로 정의해서 사용해야 함(아주 중요 - 왜냐하면, 이 패턴 이외에는 모두 1라인에 1개 은행 및 계좌번호라고 가정하고 은행데이터을 추출하기 때문임)

 

그룹23    은행 및 계좌번호 추출    오렌지    (헤더갯수 : 7개)

은행_검색위치 리본메뉴에 있는 은행계좌패턴등록 버튼과 연동되어 있음
최종 사용되는 항목은 은행_어레이임
은행_검색위치가 공백이면 같은 라인, up이면 위 라인, down이면 아래라인을 포함해서 검색함
검색하는 것은 바로 은행_검색아이템임, 인덱스항목이면서 item항목으로 한 개 라인에 한번만 실행됨
은행_계좌패턴은 userPattern쉬트에 있는 헤더와 연결됨
은행_하나캐피탈 및 은행_농협캐피탈은 각각 회사별로 사용하는 은행명칭이 상이할 경우를 가정해서 만들었으나, 2023.10.20현재 보고서항목으로 별도로 사용되고 있기에 사용하지 않음, 그래서 은행_하나캐피탈에서 정의한 은행명칭(2자리 은행명)을 인덱스로 불러서 사용함
은행_어레이는 프로그램에서 은행계좌번호를 추출할때 사용하는 어레이 item임
은행_검색아이템
은행_복수아이템
은행_계좌패턴
은행_하나캐피탈
은행_농협캐피탈
은행_어레이

 

그룹24    발행기관 추출    녹색    (헤더갯수 : 4개)

발행기관 발행기관이란 고지서 발급기관을 의미하며, 장표의 데이터를 역순으로 불러서 사용함. 즉, 모든 발행기관은 장표 맽 밑에서 15줄 이내 기관장이 표시된 곳을 읽어옴. 동시에 "수납인" 또는 "귀하"란 스트링을 같이 검색한 경우 정상적인 발행기관으로 인식함.
만약 위 조건에 부합하지 않는 발행기관은 빨간색으로 표시함
(단, 발행기관 item작성시 유니크한 문자, 즉, 서울시가 아니라 서울시장 등으로 작성해야 발행기관이 확정됨)
발행기관_하나-별명과 발행기관_농협_별명도 보고서용으로 만들었으나, 보고서항목에서 별도로 사용하기 때문에 불필요한 항목임
발행기관_별명
발행기관_하나_별명
발행기관_농협_별명

 

그룹25    자동차번호판 중간한글    파랑    (헤더갯수 : 1개)

번호판중간한글 자동차번호판 중간에 사용되는 한글 1글자, item으로 사용
자동차번호판 검색로직의 마지막에 사용됨(최초 검색시에는 한글뿐 아니라, 영문 숫자를 포함한 모든 문자 중 자동차 번호판 가능성이 있는 패턴을 검색함)

 

 

 

 

 
 
 
 
사진 및 파일 첨부

여기에 파일을 끌어 놓거나 왼쪽의 버튼을 클릭하세요.

파일 용량 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )

LOGIN

SEARCH

MENU NAVIGATION