OCR + reportistica

This commit is contained in:
2026-03-27 13:54:07 +01:00
parent cbeedc2d2f
commit bb2060c1ae
26 changed files with 5503 additions and 237 deletions
+114
View File
@@ -0,0 +1,114 @@
"""
Router Reports Dashboard e Reportistica (Fase 7).
Endpoint:
GET /reports/summary KPI + serie storica + breakdown caselle
GET /reports/export export CSV o PDF
Permessi:
- Tutti gli utenti autenticati possono accedere.
- Admin e super_admin: vedono tutto il tenant.
- Operator/Supervisor/Readonly: vedono solo le caselle su cui hanno can_read.
"""
import uuid
from datetime import datetime
from typing import Optional
from fastapi import APIRouter, Query
from fastapi.responses import Response
from app.dependencies import CurrentUser, DB
from app.schemas.reports import ReportSummaryResponse
from app.services.report_service import ReportService
router = APIRouter(prefix="/reports", tags=["Reports"])
async def _get_visible_ids(user, db) -> Optional[list[uuid.UUID]]:
"""Restituisce None per admin (nessun filtro), lista per non-admin."""
if user.is_admin:
return None
from app.services.permission_service import PermissionService
svc = PermissionService(db)
return await svc.get_visible_mailboxes(user)
# ─── GET /reports/summary ─────────────────────────────────────────────────────
@router.get("/summary", response_model=ReportSummaryResponse)
async def get_report_summary(
current_user: CurrentUser,
db: DB,
days: int = Query(7, ge=1, le=365, description="Periodo in giorni per la serie storica"),
) -> ReportSummaryResponse:
"""
Restituisce il riepilogo completo per la dashboard:
- KPI (PEC ricevute/inviate oggi, anomalie, tasso consegna, ...)
- Serie storica giornaliera per il grafico a barre
- Distribuzione stati outbound per il grafico a torta
- Statistiche per casella
"""
visible = await _get_visible_ids(current_user, db)
svc = ReportService(db)
return await svc.get_summary(
tenant_id=current_user.tenant_id,
period_days=days,
visible_mailbox_ids=visible,
)
# ─── GET /reports/export ──────────────────────────────────────────────────────
@router.get("/export")
async def export_report(
current_user: CurrentUser,
db: DB,
format: str = Query("csv", pattern="^(csv|pdf)$", description="Formato: csv o pdf"),
date_from: Optional[datetime] = Query(None, description="Data inizio (ISO 8601)"),
date_to: Optional[datetime] = Query(None, description="Data fine (ISO 8601)"),
mailbox_id: Optional[uuid.UUID] = Query(None, description="Filtra per casella specifica"),
) -> Response:
"""
Esporta i dati in formato CSV o PDF.
- CSV: lista completa dei messaggi del periodo con tutti i metadati.
- PDF: riepilogo KPI + tabella caselle (generato con reportlab).
"""
visible = await _get_visible_ids(current_user, db)
svc = ReportService(db)
now_str = datetime.now().strftime("%Y%m%d_%H%M%S")
if format == "csv":
data = await svc.export_csv(
tenant_id=current_user.tenant_id,
date_from=date_from,
date_to=date_to,
mailbox_id=mailbox_id,
visible_mailbox_ids=visible,
)
return Response(
content=data,
media_type="text/csv; charset=utf-8-sig",
headers={
"Content-Disposition": f'attachment; filename="pechub_report_{now_str}.csv"',
"Content-Length": str(len(data)),
},
)
# PDF
data = await svc.export_pdf(
tenant_id=current_user.tenant_id,
date_from=date_from,
date_to=date_to,
visible_mailbox_ids=visible,
)
return Response(
content=data,
media_type="application/pdf",
headers={
"Content-Disposition": f'attachment; filename="pechub_report_{now_str}.pdf"',
"Content-Length": str(len(data)),
},
)
+289 -11
View File
@@ -1,23 +1,57 @@
"""
Router Impostazioni Tenant (Fase 6).
Router Impostazioni Tenant.
Endpoint:
GET /settings legge le impostazioni del tenant corrente (admin)
PUT /settings aggiorna le impostazioni del tenant corrente (admin)
Endpoint esistenti:
GET /settings -> legge le impostazioni del tenant corrente (admin)
PUT /settings -> aggiorna le impostazioni del tenant corrente (admin)
Solo gli admin e super_admin possono accedere.
La sezione "archiviazione" gestisce il toggle mock/produzione per il
conservatore AgID (Fase 6 Archiviazione Sostitutiva).
Endpoint indicizzazione full-text (Fase 8):
GET /settings/indexing/stats -> statistiche copertura indicizzazione
GET /settings/indexing/status -> stato job reindex in corso
POST /settings/indexing/reindex -> avvia reindex (full o differential)
DELETE /settings/indexing/reindex -> cancella job in corso
Solo admin e super_admin possono accedere.
Il super_admin puo' operare su qualsiasi tenant tramite query param ?tenant_id=<uuid>.
"""
from fastapi import APIRouter
import uuid
from typing import Annotated, Optional
from fastapi import APIRouter, HTTPException, Query, status
from app.config import get_settings as get_app_settings
from app.dependencies import AdminUser, DB
from app.schemas.tenant_settings import TenantSettingsResponse, TenantSettingsUpdate
from app.schemas.tenant_settings import (
IndexingJobStatus,
IndexingStats,
StartReindexRequest,
StartRescanRequest,
TenantSettingsResponse,
TenantSettingsUpdate,
)
from app.services.indexing_service import IndexingService
from app.services.tenant_settings_service import TenantSettingsService
router = APIRouter(prefix="/settings", tags=["Impostazioni"])
# ─── Helper tenant_id resolution ─────────────────────────────────────────────
def _resolve_tenant_id(
current_user: AdminUser,
tenant_id_param: Optional[uuid.UUID] = None,
) -> uuid.UUID:
"""
Risolve il tenant_id da usare per l'operazione.
- super_admin: puo' passare un tenant_id arbitrario
- admin: usa sempre il proprio tenant_id (tenant_id_param ignorato)
"""
if current_user.role == "super_admin" and tenant_id_param is not None:
return tenant_id_param
return current_user.tenant_id
# ─── Impostazioni generali ────────────────────────────────────────────────────
@router.get(
"",
@@ -25,7 +59,7 @@ router = APIRouter(prefix="/settings", tags=["Impostazioni"])
summary="Legge le impostazioni del tenant",
description=(
"Restituisce la configurazione operativa del tenant: "
"modalità archiviazione (mock/produzione), endpoint e stato credenziali conservatore."
"modalita' archiviazione (mock/produzione), endpoint e stato credenziali conservatore."
),
)
async def get_settings(
@@ -44,7 +78,7 @@ async def get_settings(
description=(
"Aggiorna la configurazione operativa del tenant. "
"Tutti i campi sono opzionali (semantica PATCH). "
"Il passaggio a modalità 'production' richiede un endpoint conservatore configurato."
"Il passaggio a modalita' 'production' richiede un endpoint conservatore configurato."
),
)
async def update_settings(
@@ -57,3 +91,247 @@ async def update_settings(
await db.commit()
await db.refresh(settings)
return TenantSettingsService.to_response(settings)
# ─── Indicizzazione full-text ─────────────────────────────────────────────────
@router.get(
"/indexing/stats",
response_model=IndexingStats,
summary="Statistiche indicizzazione full-text",
description=(
"Restituisce il numero di messaggi totali, indicizzati e non indicizzati "
"per il tenant, con percentuale di copertura. "
"Include anche le statistiche sugli allegati PDF/DOCX con testo estratto. "
"Il super_admin puo' specificare ?tenant_id=<uuid> per un tenant arbitrario."
),
)
async def get_indexing_stats(
current_user: AdminUser,
db: DB,
tenant_id: Optional[uuid.UUID] = Query(
default=None,
description="(solo super_admin) UUID del tenant su cui operare",
),
) -> IndexingStats:
target_tenant_id = _resolve_tenant_id(current_user, tenant_id)
service = IndexingService(db)
stats = await service.get_stats(target_tenant_id)
return IndexingStats(**stats)
@router.get(
"/indexing/status",
response_model=IndexingJobStatus,
summary="Stato job indicizzazione in corso",
description=(
"Restituisce lo stato del job di reindex per il tenant: "
"idle, running (con progresso), completed, failed o cancelled. "
"Se il job e' running da piu' di 2 ore, il flag is_stale e' True."
),
)
async def get_indexing_status(
current_user: AdminUser,
db: DB,
tenant_id: Optional[uuid.UUID] = Query(
default=None,
description="(solo super_admin) UUID del tenant su cui operare",
),
) -> IndexingJobStatus:
target_tenant_id = _resolve_tenant_id(current_user, tenant_id)
app_settings = get_app_settings()
status_data = await IndexingService.get_job_status(
target_tenant_id, app_settings.redis_url
)
return IndexingJobStatus(**status_data)
@router.post(
"/indexing/reindex",
response_model=IndexingJobStatus,
status_code=status.HTTP_202_ACCEPTED,
summary="Avvia job di reindex",
description=(
"Avvia un job di reindex full-text in background. "
"mode='differential' indicizza solo i messaggi con search_vector NULL (piu' veloce). "
"mode='full' riscrive il vettore di tutti i messaggi del tenant. "
"Restituisce 409 se un job e' gia' in corso."
),
)
async def start_reindex(
body: StartReindexRequest,
current_user: AdminUser,
db: DB,
tenant_id: Optional[uuid.UUID] = Query(
default=None,
description="(solo super_admin) UUID del tenant su cui operare",
),
) -> IndexingJobStatus:
target_tenant_id = _resolve_tenant_id(current_user, tenant_id)
app_settings = get_app_settings()
try:
await IndexingService.start_reindex(
tenant_id=target_tenant_id,
mode=body.mode,
started_by_email=current_user.email,
redis_url=app_settings.redis_url,
db_url=app_settings.database_url,
)
except ValueError as exc:
raise HTTPException(
status_code=status.HTTP_409_CONFLICT,
detail=str(exc),
)
# Ritorna lo stato appena creato
status_data = await IndexingService.get_job_status(
target_tenant_id, app_settings.redis_url
)
return IndexingJobStatus(**status_data)
@router.delete(
"/indexing/reindex",
response_model=IndexingJobStatus,
summary="Cancella job di reindex in corso",
description=(
"Invia il segnale di cancellazione al job di reindex in corso. "
"Il job si fermera' alla fine del batch corrente (max qualche secondo). "
"Se non c'e' nessun job in corso, ritorna 404."
),
)
async def cancel_reindex(
current_user: AdminUser,
db: DB,
tenant_id: Optional[uuid.UUID] = Query(
default=None,
description="(solo super_admin) UUID del tenant su cui operare",
),
) -> IndexingJobStatus:
target_tenant_id = _resolve_tenant_id(current_user, tenant_id)
app_settings = get_app_settings()
cancelled = await IndexingService.cancel_reindex(
target_tenant_id, app_settings.redis_url
)
if not cancelled:
raise HTTPException(
status_code=status.HTTP_404_NOT_FOUND,
detail="Nessun job di reindex in corso per questo tenant",
)
status_data = await IndexingService.get_job_status(
target_tenant_id, app_settings.redis_url
)
return IndexingJobStatus(**status_data)
# ─── Scansione allegati ───────────────────────────────────────────────────────
@router.get(
"/indexing/rescan-status",
response_model=IndexingJobStatus,
summary="Stato job scansione allegati in corso",
description=(
"Restituisce lo stato del job di scansione allegati per il tenant: "
"idle, running (con progresso), completed, failed o cancelled."
),
)
async def get_rescan_status(
current_user: AdminUser,
db: DB,
tenant_id: Optional[uuid.UUID] = Query(
default=None,
description="(solo super_admin) UUID del tenant su cui operare",
),
) -> IndexingJobStatus:
target_tenant_id = _resolve_tenant_id(current_user, tenant_id)
app_settings = get_app_settings()
status_data = await IndexingService.get_rescan_status(
target_tenant_id, app_settings.redis_url
)
return IndexingJobStatus(**status_data)
@router.post(
"/indexing/rescan",
response_model=IndexingJobStatus,
status_code=status.HTTP_202_ACCEPTED,
summary="Avvia job di scansione allegati",
description=(
"Avvia un job di scansione allegati in background. "
"force=false (default): estrae il testo solo dagli allegati non ancora elaborati. "
"force=true: ri-estrae il testo da tutti gli allegati del tenant. "
"Al termine di ogni batch aggiorna anche il search_vector dei messaggi interessati. "
"Restituisce 409 se un job di scansione o reindex e' gia' in corso."
),
)
async def start_rescan(
body: StartRescanRequest,
current_user: AdminUser,
db: DB,
tenant_id: Optional[uuid.UUID] = Query(
default=None,
description="(solo super_admin) UUID del tenant su cui operare",
),
) -> IndexingJobStatus:
target_tenant_id = _resolve_tenant_id(current_user, tenant_id)
app_settings = get_app_settings()
try:
await IndexingService.start_rescan(
tenant_id=target_tenant_id,
started_by_email=current_user.email,
redis_url=app_settings.redis_url,
db_url=app_settings.database_url,
force=body.force,
)
except ValueError as exc:
raise HTTPException(
status_code=status.HTTP_409_CONFLICT,
detail=str(exc),
)
status_data = await IndexingService.get_rescan_status(
target_tenant_id, app_settings.redis_url
)
return IndexingJobStatus(**status_data)
@router.delete(
"/indexing/rescan",
response_model=IndexingJobStatus,
summary="Cancella job di scansione allegati in corso",
description=(
"Invia il segnale di cancellazione al job di scansione allegati in corso. "
"Il job si fermera' alla fine del batch corrente. "
"Se non c'e' nessun job in corso, ritorna 404."
),
)
async def cancel_rescan(
current_user: AdminUser,
db: DB,
tenant_id: Optional[uuid.UUID] = Query(
default=None,
description="(solo super_admin) UUID del tenant su cui operare",
),
) -> IndexingJobStatus:
target_tenant_id = _resolve_tenant_id(current_user, tenant_id)
app_settings = get_app_settings()
cancelled = await IndexingService.cancel_rescan(
target_tenant_id, app_settings.redis_url
)
if not cancelled:
raise HTTPException(
status_code=status.HTTP_404_NOT_FOUND,
detail="Nessun job di scansione allegati in corso per questo tenant",
)
status_data = await IndexingService.get_rescan_status(
target_tenant_id, app_settings.redis_url
)
return IndexingJobStatus(**status_data)