PDF를 CSV로 변환하는 방법

새로운 작업 계획을 논의하는 마케팅 팀

이미지 크레디트: 리틀헨라비/iStock/GettyImages

PDF(Portable Document Format) 파일은 인터넷에서 찾을 수 있으며 회사 보고서에서 세금 양식에 이르기까지 모든 것을 배포하는 데 사용됩니다. 모든 종류의 장치에서 쉽게 표시 및 인쇄하고 웹이나 이메일로 전송할 수 있습니다. 그러나 특정 작업, 특히 스프레드시트 작업의 경우 PDF 작업이 어려울 수 있습니다. 운 좋게도 PDF의 데이터를 CSV로 알려진 많은 스프레드시트 프로그램에서 사용할 수 있는 쉼표로 구분된 값 형식이나 Microsoft Excel 파일로 변환하는 도구가 있습니다.

PDF를 CSV로 변환

테이블 형식의 데이터가 포함된 PDF를 받으면 해당 데이터에 대해 다양한 종류의 분석을 실행하고 싶은 경우가 많습니다. 스프레드시트의 일부 열을 합산하거나 정보를 가지고 있는 다른 데이터와 비교하거나 막대 차트 또는 선 그래프에 표시할 수 있습니다.

오늘의 비디오

불행히도 PDF 파일에서 직접 수행하는 것은 쉽지 않습니다. 그러나 PDF를 CSV 파일로 변환하면 스프레드시트 도구, 데이터베이스 프로그램 또는 기타 여러 분석 도구로 가져올 수 있습니다. PDF를 CSV로 변환하는 데 사용할 수 있는 다양한 무료 및 유료 도구가 온라인 및 오프라인에서 제공됩니다.

광학 문자 인식 고려

경우에 따라 특히 PDF가 스캔한 문서에서 생성된 경우 컴퓨터가 이해할 수 있는 원시 문자 자체가 아닌 텍스트의 이미지만 포함될 수 있습니다. 이 경우 텍스트를 개별 단어나 숫자로 처리할 수 있는 OCR(광학 문자 인식) 프로그램을 통해 프로그램을 실행해야 할 수 있습니다.

OCR 프로그램은 완벽하지 않으므로 이러한 방식으로 PDF에서 추출한 텍스트나 숫자를 다시 확인하는 것이 좋습니다.

어도비 아크로뱃 사용

PDF 파일을 스프레드시트로 변환할 수 있는 도구 중 하나는 Adobe Acrobat입니다. Adobe는 PDF 형식의 대부분을 개발한 회사입니다. 유료 버전의 Acrobat에서 PDF 파일을 열고 Microsoft Excel 스프레드시트 파일로 내보낼 수 있습니다. CSV를 선호하는 경우 Excel 또는 대부분의 다른 스프레드시트 프로그램에서 파일을 열고 CSV로 저장할 수 있습니다.

파일을 변환하려면 Acrobat에서 파일을 열고 "PDF 내보내기"를 클릭하십시오. 스프레드시트와 "Microsoft Excel 통합 문서"를 출력 형식으로 선택합니다. "내보내기"를 클릭하고 파일을 저장할 위치를 선택하십시오. PDF가 스캔되면 Acrobat은 OCR 기술을 실행하여 텍스트를 추출합니다.

무료 평가판을 사용할 수 있지만 Acrobat을 사용하려면 비용을 지불해야 합니다.

필요한 경우 OCR 소프트웨어를 실행하는 것을 포함하여 PDF를 CSV 또는 스프레드시트 파일로 변환할 수 있는 무료 온라인 도구가 많이 있습니다.

Convertio라는 프로그램은 PDF를 CSV 파일로 변환합니다. 많은 변환이 무료이지만 OCR이나 대용량 파일 처리와 같은 서비스에 대해 비용을 지불해야 할 수도 있습니다.

또 다른 옵션은 무료로 제공되는 SodaPDF로 PDF를 Excel 파일, Microsoft Word 형식 또는 Microsoft PowerPoint 문서로 변환할 수 있습니다. 온라인에서 무료로 사용할 수 있으며 변환 프로세스를 실행한 후 PDF를 업로드하고 생성된 파일을 다운로드할 수 있습니다.

온라인 도구를 사용할 때의 한 가지 단점은 변환하려는 파일을 도구를 작동하는 사람과 공유해야 한다는 것입니다. 문서가 기밀인 경우 이 작업을 수행하지 않을 수 있습니다.

PDF를 CSV 파일이나 잠재적으로 편리한 다른 형식으로 변환하기 위해 오프라인에서 사용할 수 있는 도구도 있습니다.

하나는 Tabula라고 하며 Windows, Mac 또는 Linux에서 무료로 사용할 수 있습니다. OCR 기능이 포함되어 있지 않으므로 포함된 텍스트가 포함되지 않은 스캔한 PDF에서는 작동하지 않습니다.

Python 프로그래밍 언어와 함께 작동하는 pdf2csv라는 오픈 소스 도구도 있습니다. 오픈 소스 프로그램 저장소 GitHub에서 무료로 사용할 수 있습니다.

PDF를 텍스트로 변환할 수 있는 PDFMiner라는 무료 도구나 PDF2HTML이라는 도구를 사용할 수도 있습니다. PDF를 하이퍼텍스트 마크업 언어로 변환합니다. 텍스트로 편집하거나 웹에서 볼 수 있는 웹 페이지 파일 브라우저.