Code/Python

[python]PDF => TXT 추출

고냥정권 2019. 4. 21. 13:50

PDF에서 TXT로 글자 빼내어주기

리더기에서 다른이름으로 저장하기할 때, TXT로 해서 추출하는 방법도 있지만 내가 원하는 만큼 깔끔하지가 않아서 이 방법이 더 나은 거 같다.

import slate

pdf = 'XXX.pdf'
with open(pdf, 'rb') as f:
    doc = slate.PDF(f)

f=open('text.txt', "wt")
for s in doc:
    f.write(s)

f.close()

 

반응형

'Code > Python' 카테고리의 다른 글

[Python] struct  (0) 2019.04.28