마지막 업데이트 2025-12-19
PDF 파일에서 OCR 수행하는 방법
광학 문자 인식(OCR)을 사용하면 이미지나 스캔된 PDF 문서에서 편집 가능한 텍스트를 추출할 수 있습니다. Tenorshare PDNob를 이용하면 PDF 파일에서 OCR을 쉽게 수행하여 검색 가능하고 편집 가능한 문서로 만들 수 있습니다. 이 가이드는 OCR 기능을 설치하고 PDF에 사용하는 방법을 단계별로 안내합니다.
PDF 문서 OCR 방법 동영상 가이드
1. OCR이란 무엇인가요?
OCR(광학 문자 인식)은 스캔된 이미지나 이미지 기반 PDF 파일을 편집 가능하고 검색 가능한 텍스트로 변환하는 기술입니다. 특히 스캔된 문서나 디지털 형식의 인쇄 자료를 다룰 때 유용합니다.
2. OCR 다운로드 및 설치
- Tenorshare PDNob 소프트웨어를 컴퓨터에서 실행합니다.
- 메인 인터페이스에서 "PDF OCR" 버튼을 클릭합니다.
- 컴퓨터에서 원하는 파일을 선택한 후 "열기"를 클릭하여 PDNob에 로드합니다.
- 요청이 표시되면 "다운로드" 버튼을 클릭하여 PDF OCR 기능을 다운로드합니다.
3. PDF 파일 OCR 방법
- OCR 기능이 설치된 후 상단 툴바에서 "OCR" 버튼을 클릭하여 PDF OCR 변환 프로세스를 시작합니다.
- 설정 창이 나타납니다. 필요에 따라 설정을 검토한 후 "OCR 수행" 버튼을 클릭하여 인식 프로세스를 시작합니다.
- PDF OCR이 완료되면 PDF에서 추출된 텍스트를 복사하고 사용할 수 있습니다.
4. OCR 고급 설정 (PDNob 2.0 지원)
PDNob 2.0은 OCR 고급 설정을 도입하여 사용자가 인식 결과를 최적화할 수 있도록 합니다. 이 설정을 활성화하면 인식 정확도가 향상될 수 있지만 OCR 처리 속도가 느려질 수 있습니다.
이 옵션에 접근하려면 OCR 설정 패널을 열고 Advanced Settings를 클릭하세요. 거기에서 특정 이미지 처리 및 텍스트 감지 기능을 활성화하거나 비활성화할 수 있습니다. 이 항목의 정확한 위치는 아래 스크린샷을 참조하십시오.
이 설정에 대해 자세히 알아보려면 이 부분을 참고하세요.
- 페이지 자동 자르기 – 이미지 내 유효 콘텐츠 영역을 자동으로 감지하여 불필요한 가장자리를 자르고 페이지를 더 컴팩트하게 만들어 OCR 인식 정확도를 향상시킵니다.
- 페이지 자동 기울기 보정 – 이미지 내 텍스트 방향을 기반으로 기울어진 페이지를 자동으로 교정하여 텍스트를 수평으로 맞추고 OCR 인식 정밀도를 높입니다.
- 국부 대비 향상 – 이미지의 국부 영역에서 대비와 선명도를 향상시켜 흐릿한 텍스트의 명확성을 높이고 OCR 성공률을 증가시킵니다. 이로 인해 원본 색상이 약간 영향을 받을 수 있습니다.
- 어두운 반점 제거 – 이미지 내 작은 어두운 노이즈 점을 자동으로 감지하고 제거하여 페이지를 더 깨끗하게 만들고 OCR 결과의 깔끔함을 향상시킵니다.
- 노이즈 제거 – 이미지 내 흰 반점 및 기타 노이즈를 필터링하여 간섭을 줄이고 텍스트 가장자리를 명확하게 하여 OCR 인식 품질을 개선합니다.
- 이미지에서 텍스트 감지 – 활성화하면 OCR이 이미지 영역에서도 텍스트를 인식 및 추출하여 그림에 포함된 텍스트 내용을 캡처합니다.