PDF 파일들을 TXT 파일화 시키려고 하는데 문제가 있어서요.
책이다 보니 단어가 끊긴채로 다음 줄로 넘어가버리면 이걸 파이썬으로 읽어와도 알아서 붙는게 아니라
단어의 뜻이 깨지지 않게 붙여줘야 되는데 이작업은 어떻게 해야할지를 모르겠구요.
1,000개가 넘는 PDF파일을 한번에 TXT파일화 시켜주는 방법이 없을지 노하우가 궁금합니다.
안녕하세요. 날쌘가마우지55입니다.
온라인상에 pdf파일을 텍스트파일로 변환해주는 프로그램이 많은 것을로 알고있습니다. 한번 사용해보시는게 졸을 듯합니다