PDF OCR: 스캔한 텍스트 이미지 PDF에서 text추출, 그리고 스캔한 이미지를 모아 PDF로

§ 문서 편집/PDF .☞ 펌보다 링크를
TAG ,

저 두 가지 기능이 관심이 가네요. 저도 아직 써보지는 않았는데, 받아봐야곘습니다.

처음에는 PDF파일에서 txt를 뽑아내는 건줄 알았는데, 읽어보니 책을 스캔한 이미지를 PDF로 만든 파일에서 text를 추출하는 것입니다. 즉 OCR처럼 말이죠. 이런 건 무료인 걸 본 적이 없어서 기록해둡니다. 그리고 부가 기능으로, 스캔한 이미지를 pdf파일로 묶어줍니다. 그리고 편집 기능을 제공합니다.

PDF OCR

GAOTD 1일 무료 다운로드: http://www.giveawayoftheday.com/pdf-ocr-ocr-pdf/
제작사 홈페이지: http://www.pdfocr.net/

참고. 10개 언어 이상을 지원한다.. 고 써놨지만 한글은 안 됩니다.

ps.
설치 과정에 업데이트 인포머를 같이 깔 거냐고 묻습니다. 안 해도 쓰는 데는 상관없는 것 같습니다.
아래는 실행 화면. 설치 종료 후 뜨는 등록 코드를 적어두었다가 실행한 다음 풀다운메뉴 끝에 있는 등록 항목을 클릭해 입력해줍니다. 그리고 재시작하면 됩니다.

처음 실행하면 스캔해 PDF로 묶은 것을 OCR해 텍스트를 뽑아낼 것인지, 아니면 이미지를 PDF로 묶는 작업을 할 것인지 묻습니다.

* GAOTD 댓글 평가를 보면, 텍스트 변환을 하지만 뒷작업이 꽤 필요하다는 글이 보입니다.
이 글과 같은 분류 글목록으로 가기

트랙백 주소 :: http://pcgeeks.tistory.com/trackback/2757 관련글 쓰기

달력

«   2014/07   »
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

글 보관함

  • Total : 4,523,001
  • Today : 17
  • Yesterday : 2,678

티스토리 툴바