UNRAE PDF Scraper
Uno script Python asincrono e robusto progettato per automatizzare il download di report statistici specifici dal sito dell'Unione Nazionale Rappresentanti Autoveicoli Esteri (UNRAE), concentrandosi sui dati di immatricolazione.
Obiettivo dello Script
Il progetto nasce dall'esigenza di monitorare e analizzare specifiche tipologie di report mensili di immatricolazione veicoli, spesso disseminati nelle pagine di listing del sito UNRAE.
Questo script utilizza la potenza di Playwright per la navigazione e aiohttp per il download diretto, garantendo velocità ed efficienza.
Report Ricercati
Lo script filtra e scarica solo i documenti PDF che contengono nel titolo i seguenti elementi (ricerca case-insensitive):
immatricolazioni di autovetture per gruppiimmatricolazioni di autovetture per marcastruttura del mercatoimmatricolazioni di autovetture per provincia di residenza del proprietario
Prerequisiti
Per eseguire lo script è necessario avere installato Python 3.8+ e le librerie elencate qui sotto. Usare venv per semplicità di deploy
Installazione delle Dipendenze
-
Installa i pacchetti Python:
pip install playwright aiohttp -
Installa i driver del browser (Playwright):
playwright install chromium
Utilizzo
1. Esecuzione
Esegui lo script direttamente dalla riga di comando:
python unrae_scraper.py