Manuale d’Uso del Servizio Predict Batch

Introduzione

Il servizio Predict Batch consente di applicare un modello di Machine Learning a un dataset e ottenere come risultato un nuovo dataset contenente le predizioni.
È pensato per essere utilizzato in pipeline di analisi e validazione, ed è compatibile con i modelli generati da altri servizi del Sistema Data Analytics che utilizzano le stesse librerie (ad es. scikit-learn e MLflow).

Funzionalità del Servizio

Caricamento del modello
Supporta modelli addestrati con scikit-learn o salvati tramite MLflow, compatibili con gli altri servizi del Sistema Data Analytics.
Predizione sul dataset
Esegue il metodo di predizione configurato (predict, predict_proba o altro) e aggiunge i risultati come nuove colonne al dataset.
Generazione di grafici di supporto
Se l’utente specifica il parametro prediction_type, vengono creati grafici che riassumono la distribuzione dei risultati:
regressione → distribuzione dei valori previsti,
classificazione binaria → distribuzione delle classi,
classificazione multiclasse → distribuzione per classe,
probabilità → distribuzione delle probabilità medie.

⚠️ I grafici sono costruiti solo sui valori di predizione ottenuti; il modello non viene interrogato ulteriormente.
Per questo motivo, il parametro prediction_type deve essere coerente con il predict_method selezionato.

Registrazione del risultato
Il dataset arricchito con le colonne di predizione viene salvato e reso disponibile come nuovo asset all’interno della pipeline del Sistema Data Analytics.

Parametri Configurabili

predict_method (opzionale, default: predict)
Indica quale metodo del modello deve essere usato per calcolare le predizioni.
Esempio: predict per etichette discrete o valori numerici, predict_proba per probabilità.
feature_method (opzionale, default: nessuno)
Permette di specificare un metodo o attributo del modello da cui estrarre i nomi delle feature attese.
Utile per garantire l’allineamento corretto tra le colonne del dataset e il modello.
Se non impostato, vengono usate direttamente le colonne del dataset.
prediction_type (opzionale, default: nessuno)
Definisce il tipo di problema e di conseguenza i grafici da generare a partire dai risultati:
regression, binary, multiclass, proba.
Deve essere coerente con il predict_method scelto.
Se non impostato, il servizio esegue solo la predizione senza generare grafici.

Utilizzo del Servizio

Selezionare un dataset di input e un modello compatibile (sklearn/MLflow).
Configurare, se necessario, i parametri predict_method, feature_method e prediction_type.
Avviare l’esecuzione.
Ottenere come output un dataset arricchito con le predizioni, e se configurato, i grafici riassuntivi.

Vantaggi

Compatibilità diretta con i modelli generati nel Sistema Data Analytics (sklearn, MLflow).
Flessibilità nella scelta del metodo di predizione.
Supporto visivo per comprendere l’andamento dei risultati.
Automazione: il dataset arricchito è pronto per essere utilizzato in ulteriori analisi o pipeline.