Vai al contenuto

Manuale d'Uso del Servizio di Visualizzazione Dati

Introduzione

Questo servizio consente di generare un report HTML interattivo per l'esplorazione del dataset, utilizzando la libreria ydata-profiling. Il report può essere generato come:

  • Report esplorativo standard,
  • Report per serie temporali (EDA temporale),
  • Report stratificato per classe target (solo classi binarie).

Il servizio è utile per effettuare analisi esplorative dei dati in modo rapido, visualizzando la distribuzione delle variabili, la presenza di valori mancanti, le correlazioni, e altre statistiche descrittive.

Funzionalità del Servizio

1. Report Esplorativo

In assenza di parametri opzionali, viene generato un report interattivo con analisi esplorativa generica del dataset.

2. Report Serie Temporali

Se viene specificata la colonna timestamp_column, il servizio utilizza la modalità temporale di ydata-profiling (tsmode=True), ordinando le righe del dataset secondo la colonna indicata. Questo tipo di report è adatto per dati temporali.

3. Report Stratificato per Target

Se viene specificata la colonna target_column, il servizio genera un report per ciascun valore distinto della colonna target, confrontando i diversi profili generati. Se le classi nella colonna specificata come target sono più di 2 il servizio andrà in errore e non sarà in grado di produrre il risultato atteso.

4. Personalizzazione tramite Parametri Diretti

Attraverso l'argomento direct_args_to_ProfileReport, è possibile specificare in formato JSON ulteriori parametri direttamente compatibili con la funzione ProfileReport, per personalizzare il comportamento del servizio (es. disattivare alcune sezioni del report, cambiare il titolo, ecc.).

Utilizzo del Servizio

Caricamento del Dataset

L'utente deve caricare un dataset tabellare compatibile (ad esempio in formato CSV).

Configurazione dei Parametri

  • timestamp_column (opzionale): nome della colonna da usare per l'ordinamento temporale.
  • target_column (opzionale): nome della colonna target per la stratificazione.
  • direct_args_to_ProfileReport (opzionale): dizionario JSON di parametri per la funzione ProfileReport.

Se vengono forniti sia timestamp_column che target_column, ha la precedenza la modalità temporale.

Output

Il servizio produce un file HTML intitolato profiling_report.html, visualizzabile all'interno della piattaforma tramite gli application media presenti al completamento del run del servizio.

Riferimenti Utili