Manuale d’Uso del Servizio Predict Batch
Introduzione
Il servizio Predict Batch consente di applicare un modello di Machine Learning a un dataset e ottenere come risultato un nuovo dataset contenente le predizioni.
È pensato per essere utilizzato in pipeline di analisi e validazione, ed è compatibile con i modelli generati da altri servizi del Sistema Data Analytics che utilizzano le stesse librerie (ad es. scikit-learn e MLflow).
Funzionalità del Servizio
-
Caricamento del modello
Supporta modelli addestrati con scikit-learn o salvati tramite MLflow, compatibili con gli altri servizi del Sistema Data Analytics. -
Predizione sul dataset
Esegue il metodo di predizione configurato (predict,predict_probao altro) e aggiunge i risultati come nuove colonne al dataset. -
Generazione di grafici di supporto
Se l’utente specifica il parametro prediction_type, vengono creati grafici che riassumono la distribuzione dei risultati: - regressione → distribuzione dei valori previsti,
- classificazione binaria → distribuzione delle classi,
- classificazione multiclasse → distribuzione per classe,
- probabilità → distribuzione delle probabilità medie.
⚠️ I grafici sono costruiti solo sui valori di predizione ottenuti; il modello non viene interrogato ulteriormente.
Per questo motivo, il parametro prediction_type deve essere coerente con il predict_method selezionato.
- Registrazione del risultato
Il dataset arricchito con le colonne di predizione viene salvato e reso disponibile come nuovo asset all’interno della pipeline del Sistema Data Analytics.
Parametri Configurabili
- predict_method (opzionale, default:
predict)
Indica quale metodo del modello deve essere usato per calcolare le predizioni. -
Esempio:
predictper etichette discrete o valori numerici,predict_probaper probabilità. -
feature_method (opzionale, default: nessuno)
Permette di specificare un metodo o attributo del modello da cui estrarre i nomi delle feature attese.
Utile per garantire l’allineamento corretto tra le colonne del dataset e il modello.
Se non impostato, vengono usate direttamente le colonne del dataset. -
prediction_type (opzionale, default: nessuno)
Definisce il tipo di problema e di conseguenza i grafici da generare a partire dai risultati: regression,binary,multiclass,proba.
Deve essere coerente con ilpredict_methodscelto.
Se non impostato, il servizio esegue solo la predizione senza generare grafici.
Utilizzo del Servizio
- Selezionare un dataset di input e un modello compatibile (sklearn/MLflow).
- Configurare, se necessario, i parametri
predict_method,feature_methodeprediction_type. - Avviare l’esecuzione.
- Ottenere come output un dataset arricchito con le predizioni, e se configurato, i grafici riassuntivi.
Vantaggi
- Compatibilità diretta con i modelli generati nel Sistema Data Analytics (sklearn, MLflow).
- Flessibilità nella scelta del metodo di predizione.
- Supporto visivo per comprendere l’andamento dei risultati.
- Automazione: il dataset arricchito è pronto per essere utilizzato in ulteriori analisi o pipeline.