ocr.msr
물론 수식이 많은 문제는 이 방법이 어렵습니다만, 글자가 많은 문제는 비교적 유용합니다. 다음과 같은 과정을 따릅니다.
1.
ABBYY finereader라는 OCR 프로그램이 있습니다. alt+print screen 키를 누르면 활성화된 창이 클립보드로 캡쳐 되는데요, ABBYY finereader에 ctrl-v 를 하면 그대로 들어갑니다.
2. OCR 인식할 영역을 설정해 주시고 텍스트 인식을 시도합니다.
3. 인식된 텍스트를 그대로 카피 (ctrl-c) 합니다.
3. 첨부된 스크립트 매크로를 실행하면 vbscript로 만든 입력박스가 실행됩니다. 여기에 붙여넣기 하면 됩니다.
스크립트 코드가 800줄 이상으로 꽤 긴데, 대부분 replace 함수로 돼 있고, 각종 OCR 인식 실패에 대한 rule-base translation의 역할을 합니다. 대충 보시면 이해 될 듯 합니다.
오류가 없진 않습니다만, 스크립트를 더 수정하면 꽤 많은 오류를 해결할 수 있습니다.
----------------------
2018.2.11
스크립트 코드를 일부 수정했습니다. 수식감지와 오류 수정이 향상되었습니다.
-----------------------
2018.3.2
명사의 밭침을 판정하여 조사 '을','를','이','가'의 결정부분을 변경했습니다.