userDB는 총 63개의 헤더를 가지고 있음
그룹1 OCR작업용 분홍색 (헤더갯수 : 2개)
OCR헤더 | 이곳에서 정해진 순서로 OCR쉬트에 헤더를 생산한다 단, 일부 헤더의 데이터는 선행 데이터를 기반으로 하는 경우에는 오류가 발생할 수 있다. 헤더 넓이는 칼럼 넓이이다. |
헤더넓이 |
그룹2 보고서 업체별 작성용 노란색 (헤더갯수 : 2개)
하나캐피탈헤더 | 이 헤더는 어레이 구성임(OCR헤더|별명헤더|칼럼넓이) OCR헤더에서 데이터를 가져오며, 별명헤더로 헤더이름을 바꿔주고, 칼럼넓이는 보고서 작성시 칼럼의 크기를 조정한다 |
농협캐피탈헤더 |
그룹3 수신인(업체명) 연녹색 (헤더갯수 : 4개)
수신인 | 수신인은 색인(index)로 사용되는 항목(item)이며, 수신인 별명은 OCR쉬트에 보여주는 수신인 이름이다. 하나캐피탈소유차량에 번호가 등록되면, 수신인_별명이 하나캐피탈인 경우 차량번호를 검증한다.(없는 경우는 일반로직으로 검증- 2023.10.20 현재 일반로직은 반영안됨) 하나캐피탈업무용에 등록된 차량번호는 별도로 표시한다(2023.10.20 현재 반영안됨) 만약, 다른 회사용 차량을 검증하고 싶을때, 이 칼럼 뒤에 삽입후 module에서 수정해야 한다. |
수신인_별명 | |
하나캐피탈소유차량 | |
하나캐피탈업무용 |
그룹4 장표종류 하늘색 (헤더갯수 : 2개)
장표종류 | 장표종류는 본 프로그램 목적상 임의로 부여된 항목이다. (실제 장표종류 구분하기 위함이 아니다) 장표에서 유니크한 항목을 구분하기 위해서 만들어졌으며, 데이터 추출하기 어려운 항목에서 사용된다(주로 블럭데이터 추출 등) |
장표종류_별명 |
그룹5 전자납부번호 진갈색 (헤더갯수 : 2개)
전자납부번호 | 전자납부번호 검증(validation)을 위해서 만들어진 항목으로 자세한 설명은 전자납부번호를 참고할것 |
전자납부번호패턴 |
그룹6 전자납부번호 기관코드 진청색 (헤더갯수 : 2개)
그룹7 전자납부번호 위반코드 분홍색 (헤더갯수 : 2개)
그룹8 전자납부번호 과세코드 연녹색 (헤더갯수 : 1개)
전자납부_기관코드 | 위 항목은 출처가 없이 데이터에서 추출한 자료임 따라서 위반코드, 과세코드라는 명칭도 임의로 부여된자료임 |
전자납부_기관코드_별명 | |
전자납부_위반코드 | |
전자납부_위반유형 | |
전자납부_과세코드 |
그룹9 날짜데이터 노란색 (헤더갯수 : 6개)
group_no | group_no는 사실상 불핃요한 항목임 날짜데이터는 패턴 매이커를 이용해서 만들면 됩니다. Datevalue와 Timevalue는 길이(length)를 의미하며 좌우공백은 길이에서 사용하지 않음 납기내기한과 납기후기한은 인덱스항목임(패턴인덱스, 참고로 item인덱스항목과 사용법이 다름) |
날짜데이터 | |
DateValue | |
TimeValue | |
납기내기한 | |
납기후기한 |
그룹10 시간데이터 패턴 회색 (헤더갯수 : 2개)
시간_패턴 | 날짜데이터 항목중 시간만 분리해서 데이터를 추출하는 부분임 OCR쉬트에서는 사용하지 않음, 단순히 날짜데이터와 시간데이터가 다른 셀에 위치하는 경우에 합치기 위해서 만든 항목임 |
Time_len |
그룹11 수신인주소 흰색 (헤더갯수 : 1개)
수신인주소 | 현재 사용하지 않는 항목임(임시) |
그룹12 사고일시 하늘색 (헤더갯수 : 2개)
사고일시 | 에레이 구분자&뒤에 있는 구분자는 배제조건임(예, 위반&정차는 위반은 true, 정차는 false를 동시에 만족해야 함) 위반내용중사고일시배제 항목은 위반내용에 item이 있으면 사고일시를 추출하지 못해도 ok를 나타냄(2023.10.20 현재 이 용도 불확실한 상태임) |
위반내용중사고일시배제 |
그룹13 금액데이터 오렌지 (헤더갯수 : 3개)
금액데이터_패턴 | 금액을 추출하기 위한 패턴으로사용되며, 패턴에 들어있는 숫자 이외의 문자는 추출용으로만 사용되고 데이터에서 버림 납기내금액과 납기후금액은 인덱스 item으로 사용되며, 금액중 OCR장표에 OCR용 캐릭터금액패턴(\s\+(\d+)\d{1}<\s)이 최우선순위를 갖고 있음 |
납기내금액 | |
납기후금액 |
그룹14 위반장소 진파랑 (헤더갯수 : 4개)
위반장소 | 위반장소 문장단위가 검색의 기본임, 어레이는 &는 구분자임 구분자 가 왼쪽에block이 표시되면 블락단위로 검색함(x,y좌표중 y위주로 검색) 구분자 앞에 left는 문장을 왼쪽에서 검색함 위반장소_제외글자는 item으로 사용되며 해당 문자부터 오른쪽에 있는 문자 전부를 삭제함(2023.10.20 최초조건만족시 종료 로직이나, 계속 루핑하는 로직으로 변경하는 것을 고려중임) 위반장소_패턴도 어레이를 사용하며, from추출문자to문자 패턴임 발행기관별_위반장소도 어레이 패턴이며, 구분자는 &이고, 발행기관에 따라 위반장소가 정해지는 항목임(조심해서 사용할 것, 민자터널과 같이 발행기관이름이 1개의 위반항목이 있는 경우에만 사용할 것) |
위반장소_제외글자 | |
위반장소_패턴 | |
발행기관별_위반장소 |
그룹15 위반건수 회색 (헤더갯수 : 1개)
위반건수 | 위반건수 추출을 위해서 만들었으나, 2023.10.20현재 로직으로 추출하며, userDB에서는 사용하고 있지 않음 |
그룹16 위반유형 코드 흰색 (헤더갯수 : 3개)
위반내용_별명_인덱스 | 하나캐피탈용 보고서 작성시 사용하는 코드로 위반유형(별명)에 매치시켜서 사용하는 단순 코드임 |
위반유형 | |
통보유형 |
그룹17 위반내용 녹색 (헤더갯수 : 4개)
위반내용 | 위반내용은 인덱스용 item이며, 별명은 보고서용 명칭임 위반유형_코드와 통보유형_코드를 여기서 직접 보고서 작성할때 사용하려고 만들었으나, 보고서작성회사별로 상이할 수 있어서 사용을 보류함 |
위반내용_별명 | |
위반유형_코드 | |
통보유형_코드 |
그룹18 통행료차수 흰색 (헤더갯수 : 1개)
통행료차수 | 단순 인덱스용 item임 |
그룹19 차량번호 노란색 (헤더갯수 : 2개)
차량번호 | 차량번호는 2023.10.20현재 패턴을 사용중이기 때문에 1차 검색에서는 사용하지 않으나, 3차 검색에서 사용함 차량번호_패턴은 2023.10.20현재 사용하고 있지 않음 |
차량번호_패턴 |
그룹20 부가, 최장 흰색 (헤더갯수 : 1개)
부가최장 | 부가통행료와 최장통행료를 추출하기 위해 예비용으로 만든 항목임(2023.10.20 현재 사용하지 않고 로직에서 구현함) |
그룹21 은행 코드 추출용 파랑 (헤더갯수 : 3개)
은행_인덱스 | 하나캐피탈용 보고서 작성시 사용하는 코드임, 은행_인덱스의 길이(렝쓰)는 2자리 고정임 |
은행_풀네임 | |
은행코드 |
그룹22 복수은행 패턴 추출용 회색 (헤더갯수 : 1개)
복수은행_패턴 | Text라인에 복수의 은행 및 계좌번호가 나오는 경우, 패턴으로 정의해서 사용해야 함(아주 중요 - 왜냐하면, 이 패턴 이외에는 모두 1라인에 1개 은행 및 계좌번호라고 가정하고 은행데이터을 추출하기 때문임) |
그룹23 은행 및 계좌번호 추출 오렌지 (헤더갯수 : 7개)
은행_검색위치 | 리본메뉴에 있는 은행계좌패턴등록 버튼과 연동되어 있음 최종 사용되는 항목은 은행_어레이임 은행_검색위치가 공백이면 같은 라인, up이면 위 라인, down이면 아래라인을 포함해서 검색함 검색하는 것은 바로 은행_검색아이템임, 인덱스항목이면서 item항목으로 한 개 라인에 한번만 실행됨 은행_계좌패턴은 userPattern쉬트에 있는 헤더와 연결됨 은행_하나캐피탈 및 은행_농협캐피탈은 각각 회사별로 사용하는 은행명칭이 상이할 경우를 가정해서 만들었으나, 2023.10.20현재 보고서항목으로 별도로 사용되고 있기에 사용하지 않음, 그래서 은행_하나캐피탈에서 정의한 은행명칭(2자리 은행명)을 인덱스로 불러서 사용함 은행_어레이는 프로그램에서 은행계좌번호를 추출할때 사용하는 어레이 item임 |
은행_검색아이템 | |
은행_복수아이템 | |
은행_계좌패턴 | |
은행_하나캐피탈 | |
은행_농협캐피탈 | |
은행_어레이 |
그룹24 발행기관 추출 녹색 (헤더갯수 : 4개)
발행기관 | 발행기관이란 고지서 발급기관을 의미하며, 장표의 데이터를 역순으로 불러서 사용함. 즉, 모든 발행기관은 장표 맽 밑에서 15줄 이내 기관장이 표시된 곳을 읽어옴. 동시에 "수납인" 또는 "귀하"란 스트링을 같이 검색한 경우 정상적인 발행기관으로 인식함. 만약 위 조건에 부합하지 않는 발행기관은 빨간색으로 표시함 (단, 발행기관 item작성시 유니크한 문자, 즉, 서울시가 아니라 서울시장 등으로 작성해야 발행기관이 확정됨) 발행기관_하나-별명과 발행기관_농협_별명도 보고서용으로 만들었으나, 보고서항목에서 별도로 사용하기 때문에 불필요한 항목임 |
발행기관_별명 | |
발행기관_하나_별명 | |
발행기관_농협_별명 |
그룹25 자동차번호판 중간한글 파랑 (헤더갯수 : 1개)
번호판중간한글 | 자동차번호판 중간에 사용되는 한글 1글자, item으로 사용 자동차번호판 검색로직의 마지막에 사용됨(최초 검색시에는 한글뿐 아니라, 영문 숫자를 포함한 모든 문자 중 자동차 번호판 가능성이 있는 패턴을 검색함) |