Manuale d'Uso del Servizio di Visualizzazione Dati
Introduzione
Questo servizio consente di generare un report HTML interattivo per l'esplorazione del dataset, utilizzando la libreria ydata-profiling. Il report può essere generato come:
- Report esplorativo standard,
- Report per serie temporali (EDA temporale),
- Report stratificato per classe target (solo classi binarie).
Il servizio è utile per effettuare analisi esplorative dei dati in modo rapido, visualizzando la distribuzione delle variabili, la presenza di valori mancanti, le correlazioni, e altre statistiche descrittive.
Funzionalità del Servizio
1. Report Esplorativo
In assenza di parametri opzionali, viene generato un report interattivo con analisi esplorativa generica del dataset.
2. Report Serie Temporali
Se viene specificata la colonna timestamp_column, il servizio utilizza la modalità temporale di ydata-profiling (tsmode=True), ordinando le righe del dataset secondo la colonna indicata. Questo tipo di report è adatto per dati temporali.
3. Report Stratificato per Target
Se viene specificata la colonna target_column, il servizio genera un report per ciascun valore distinto della colonna target, confrontando i diversi profili generati. Se le classi nella colonna specificata come target sono più di 2 il servizio andrà in errore e non sarà in grado di produrre il risultato atteso.
4. Personalizzazione tramite Parametri Diretti
Attraverso l'argomento direct_args_to_ProfileReport, è possibile specificare in formato JSON ulteriori parametri direttamente compatibili con la funzione ProfileReport, per personalizzare il comportamento del servizio (es. disattivare alcune sezioni del report, cambiare il titolo, ecc.).
Utilizzo del Servizio
Caricamento del Dataset
L'utente deve caricare un dataset tabellare compatibile (ad esempio in formato CSV).
Configurazione dei Parametri
timestamp_column(opzionale): nome della colonna da usare per l'ordinamento temporale.target_column(opzionale): nome della colonna target per la stratificazione.direct_args_to_ProfileReport(opzionale): dizionario JSON di parametri per la funzione ProfileReport.
Se vengono forniti sia
timestamp_columnchetarget_column, ha la precedenza la modalità temporale.
Output
Il servizio produce un file HTML intitolato profiling_report.html, visualizzabile all'interno della piattaforma tramite gli application media presenti al completamento del run del servizio.