pdf텍스트를 추출할 수 있는 방법은 많습니다. 나에게 편한 방법을 활용하는 게 제일 좋겠지요. 기존의 워드 문서나 ppt문서들에 비해 활용도가 많아지고 있기 때문에 알아두면 좋은 상식이 될 수도 있습니다. 

<pdf텍스트 추출 세 가지 방법>

단순히 파일을 읽는 것은 문제가 되지 않습니다. 아크로벳 리더 소프트웨어를 쓰면 되지요. 무료 프로그램이라 누구나 사용할 수 있습니다. 하지만, 텍스트를 가지고 나온다거나 편집을 하는 건 무료로 할 수 없습니다. 아래 세 가지 방법 중 편한 걸 활용해 보세요.

기본 텍스트 추출

기본적으로 텍스트 자체를 복사하는 건 가능합니다. 아크로벳 리더 등으로 연 뒤에 드래그해서 원하는 만큼의 글자들을 그대로 복사해서 원하는 플랫폼에 붙여넣기 하면 되겠지요. 주로 워드 프로그램이나 메모장 등에 넣어서 재활용할 수 있을 것입니다. 하지만, 보통은 이게 안돼서 방법을 찾게 되겠지요? 

pdf 텍스트 추출 방법

구글 활용하기

요샌 구글을 안 쓰는 사람이 없을 정도로 활성화되어 있습니다. 하지만, 구글 드라이브는 안 쓰는 분들도 있는데, 이참에 활용해보시기 바랍니다. 너무 편하고 좋은 서비스거든요. PDF파일을 나의 구글 드라이브에 업로드하세요. 그리고, 구글 문서로 이 파일을 열어보면 됩니다. 이때는 아크로벳 리더로 읽었을 때 선택할 수 없었던 텍스트들을 선택해서 복사할 수 있습니다. 

알PDF 활용하기 - OCR 기능

ocr 기능은 이미지, 텍스트 등을 추출하는 기능을 말합니다. 많은 프로그램들이 있지만, 접근성도 좋고 신뢰할 수 있는 알PDF를 추천해 봅니다. 설치는 어렵지 않고 무료 소프트웨어라 누구나 활용할 수 있습니다. (기업이라면 저작권 확인 필수). 

알pdf ocr 기능

설치 후 파일을 열고 상단 메뉴 중 '문자인식(OCR)'을 선택해주세요. 별도의 플러그인을 설치해야 한다고 나오면 설치 후 이용하면 되겠습니다. 그리고 나서 상단 메뉴 중 '문구 편집'을 선택해주면, pdf텍스트 모두를 추출할 수 있는 상태가 됩니다. 

어렵지 않게 할 수 있는 만큼 필요할 때 유용하게 쓰면 되겠습니다.^^

[참고 글]

- pdf 따는 법 간단하게

- 모든 파일 pdf로 쉽게 변환하기

- 알집 비밀번호 푸는 방법

+ Recent posts