Primeiro clone o repositório na sua máquina
Após a clonagem entre na pasta pdf_extractor e em seguida crie uma pasta pdfs para guardar os seus pdfs
Crie um ambiente virtual *Opcional
python -m venv env
Após criar o ambiente virtual *Opcional
source ./env/bin/active
Certifique-se de instalar os seguintes componentes para o sistema operacional:
tesseract-ocr poppler-utils
Após concluídas as etapas anteriores:
Instale as extensões do python
pip install -r requirements.txt
Rode o programa
python setup.py