풀버전 텍본메이커 v0.40
https://mega.nz/#!p2gF1AKR!q2pbPNfpufdITqWSJrZ3lGFZNKPyPbtxEOLHlUysJHk
텍본메이커 v0.41패치
https://mega.nz/#!V3oHgQ4R!sHqKxczT40dIFwrjF_AkM_V8Ts90NUb1IYlyoHvt6ig
설치 방법:
풀버전을 받아서 설치하신 분은 아래 텍본메이커 v0.41패치를 받아서 텍본메이커 풀버전 폴더에 덮어씌우면 됩니다.
이번 패치 내역:
댓글에 요청하신 분들이 있어서 이어 붙이기 옵션들과 따로 필터 적용 기능을 추가 했습니다.
드래그엔드랍 외에 ctrl+c로 파일경로를 입력할 수 있게 했습니다.
방법은 파일 탐색기에서 ctrl+c로 입력할 파일을 선택하고 입력할 곳(리스트박스,텍스트박스)을 더블클릭해 주면 됩니다.
이전 버전의 자세한 사용법:
--설치&사용
압축풀고 TecVon2.exe를 실행하면 됩니다.
캡춰본 gif,jpg,png등을 드래그해서 집어넣고 maketext버튼을 누르면 텍본이 되서 나옵니다.
실행이 안되는 분은, 윈도우 7,10 다 지원하므로 고민하지 마시고
microsoft runtime library를 구글 검색해서 받아서 설치하세요.
(현재위치: https://support.microsoft.com/en-us/help/2977003/the-latest-supported-visual-c-downloads)
테세렉트 5.0알파 32비트 버전을 원하시는 분들은,
https://github.com/UB-Mannheim/tesseract/wiki
여기 방문하면,
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w32-setup-v5.0.0-alpha.20191030.exe
이렇게 링크가 있네요. 받아서 설치하시고 제가 올린 64비트에 덮어씌우면 될겁니다.
기타 설명:
PSM모드: 그림파일에서 글자를 인식하는 과정 중에 페이지를 분할하는 모드.
1번으로 하면 보통 한 그림파일 안에 2페이지 이상이 있는 경우에 양면을 모두 인식함.
기존 6번으로 하며, 총 13개의 모드가 있음. 보통 개발자나 특수한 경우 아니면 1 아니면 6만 사용함.
Traindata: 인식 언어나 조건 등이 훈련되어 있는 파일.
kor를 선택하면 영어를 인식 못하지만 한글을 전문적으로 인식함.(한글 가로 인식)
Hangul을 선택하면 한글+영어를 모두 인식함.
jpn_vert을 선택하면 일본어세로 쓰기를 인식함. 그냥 jpn은 가로읽기.
등등 다양한 언어를 인식할 수 있음. 그 외에 언어는 위키에서 tesseract를 찾아보면 다운로드 가능.
문장연결을 누르면 줄띄우기가 안되고 다닥다닥 붙어서 나옵니다.
필터표시는 필터가 적용된 부분에 앞뒤로 특수문자표시가 됩니다. 잘못된 필터가 적용된 단어를 찾을 때 편리합니다.
Merge Text버튼은 txt파일 여러개를 하나로 병합해줍니다.
사용법은 txt파일들을 드래그&드랍해주고 버튼을 누르면 하나로 합쳐져서 복사됩니다.
Tesseract5버튼은 누르면 tesseract4로 전환이 가능합니다.
4는 쓸일이 없는데 혹시라도 알 수 없는 이유로 5가 안되면 쓸 수 있으니 남겨두었습니다.
Filter Editor는 이번에 새로 추가한 기능입니다.
열면 필터가 보이고 맨 아래줄에 필터 단어를 입력해서 추가할 수 있지요.
아래쥴(탭키를 한번 눌러줌)아래줄(추가 버튼을 누름)
이러면 필터에 새로운 항목이 추가되고, 텍본메이커로 택본을 추출할 때 앞에 입력한 '아래쥴' 이라는 단어가 나오면 자동으로 '아래줄'로 바뀌게 됩니다.
수정 전후, 분석 버튼의 사용법은,
텍본을 추출한 다음에 tecvon.txt(원본)를 tecvon_copy.txt라던가로 하나 더 복사를 한 후에,
손수정을 합니다. 그러면 손수정된 버전과 수정 전의 원본을 드래그엔 드랍해서 각자의 위치에 넣어줍니다.
그리고 분석 버튼을 누르면 오른쪽 리스트에 213,214 같이 목록이 뜹니다.
그걸 누르면 프로그램이 수정전 파일과 수정 후 파일을 비교해서
아래 텍스트 박스에 손수정한 부분과 수정한 내역이 뜨고 필터 형식으로 나옵니다.
예를들어서,
(원본)아크는 사냥굼이다->(손수정)아크는 사냥꾼이다
이런 경우에 분석을 누르면 원본과 수정본을 비교해서 수정한 줄과 그와 유사한 줄이 리스트에 123,124(각 문서에서 감지된 줄 수) 같이 표시되고 그걸 누르면,
사냥굼이다{텝키}사냥꾼이다
이렇게 필터에 추가할 내용이 제안됩니다.
내용을 살펴보고 등록할 만하면 등록하고 아니면 수정해서 등록하거나 넘어가면 됩니다.
문장 이어주기 에디터 들어와서 문장연결 끈 파일 만들어서 드래그 앤 드랍 후 실행을 누르니까 [파일을 텍스트받스에 입력(드래그 엔 드랍)하세요. 라는 문구만 뜨고 파일이 안 돌아가요..
1. 이유는 모르겠으나 알림바만 떠요
2. 알림바 문구가 적힌 글에 텍스트받스 라고 적혀 있는 거.. 텍스트박스라고 수정해 주세요 (드래그 엔 드랍)은 (드래그 앤 드랍)이 낫지 않나..이건 잘 모르겠네요
텍본메이커 v0.421 패치입니다. 덮어씌우면 됩니다.
드래그앤드랍에 버그가 있어서 직접 파일이름을 입력하거나 ctrl+c더블클릭으로 입력하는 것만 가능했던 버그를 고쳤습니다.