mirror of
https://github.com/idrainformatica/UNRAE-Scraper.git
synced 2026-04-18 01:53:22 +02:00
50 lines
1.5 KiB
Markdown
50 lines
1.5 KiB
Markdown
# UNRAE PDF Scraper
|
|
|
|
Uno script Python **asincrono** e **robusto** progettato per automatizzare il download di report statistici specifici dal sito dell'**Unione Nazionale Rappresentanti Autoveicoli Esteri (UNRAE)**, concentrandosi sui dati di immatricolazione.
|
|
|
|
---
|
|
|
|
## Obiettivo dello Script
|
|
|
|
Il progetto nasce dall'esigenza di monitorare e analizzare specifiche tipologie di report mensili di immatricolazione veicoli, spesso disseminati nelle pagine di listing del sito UNRAE.
|
|
|
|
Questo script utilizza la potenza di **Playwright** per la navigazione e **aiohttp** per il download diretto, garantendo velocità ed efficienza.
|
|
|
|
### Report Ricercati
|
|
|
|
Lo script filtra e scarica solo i documenti PDF che contengono nel titolo i seguenti elementi (ricerca *case-insensitive*):
|
|
|
|
* `immatricolazioni di autovetture per gruppi`
|
|
* `immatricolazioni di autovetture per marca`
|
|
* `struttura del mercato`
|
|
* `immatricolazioni di autovetture per provincia di residenza del proprietario`
|
|
|
|
---
|
|
|
|
## Prerequisiti
|
|
|
|
Per eseguire lo script è necessario avere installato **Python 3.8+** e le librerie elencate qui sotto.
|
|
Usare venv per semplicità di deploy
|
|
|
|
### Installazione delle Dipendenze
|
|
|
|
1. **Installa i pacchetti Python:**
|
|
```bash
|
|
pip install playwright aiohttp
|
|
```
|
|
|
|
2. **Installa i driver del browser (Playwright):**
|
|
```bash
|
|
playwright install chromium
|
|
```
|
|
---
|
|
|
|
## Utilizzo
|
|
|
|
### 1. Esecuzione
|
|
|
|
Esegui lo script direttamente dalla riga di comando:
|
|
|
|
```bash
|
|
python unrae_scraper.py
|