Skip to content

Ferramenta para realizar download de teses e dissertações da CAPES

License

Notifications You must be signed in to change notification settings

ApoenaX/theses-scraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

uv Python 3.12

theses-scraper

Script para fazer download das teses e dissertações em repositórios de universidades brasileiras. No momento, o script suporta alguns repositórios específicos, mas a ideia é expandir para outros repositórios.

Início Rápido

  1. Instalar dependências do projeto
git clone https://github.com/ApoenaX/theses-scraper.git
cd theses-scraper && pip install .

Usando a bilioteca

  1. Download de um trabalho
from theses_scraper.parsers import ParserFactory
from theses_scraper.downloader import DocumentDownloader

url = "https://monografias.ufma.br/jspui/handle/123456789/3510"

parser = ParserFactory.get_parser(url)
document: str | list[str] = parser.get_pdf_link(url)

downloader = DocumentDownloader("./data")
downloader.download(document)

Releases

No releases published

Packages

No packages published

Languages