PDF에서 TXT로 글자 빼내어주기
리더기에서 다른이름으로 저장하기할 때, TXT로 해서 추출하는 방법도 있지만 내가 원하는 만큼 깔끔하지가 않아서 이 방법이 더 나은 거 같다.
import slate
pdf = 'XXX.pdf'
with open(pdf, 'rb') as f:
doc = slate.PDF(f)
f=open('text.txt', "wt")
for s in doc:
f.write(s)
f.close()
반응형
'Code > Python' 카테고리의 다른 글
[Python] struct (0) | 2019.04.28 |
---|