Vai al contenuto

Manuale d’Uso del Servizio Predict Batch

Introduzione

Il servizio Predict Batch consente di applicare un modello di Machine Learning a un dataset e ottenere come risultato un nuovo dataset contenente le predizioni.
È pensato per essere utilizzato in pipeline di analisi e validazione, ed è compatibile con i modelli generati da altri servizi del Sistema Data Analytics che utilizzano le stesse librerie (ad es. scikit-learn e MLflow).

Funzionalità del Servizio

  1. Caricamento del modello
    Supporta modelli addestrati con scikit-learn o salvati tramite MLflow, compatibili con gli altri servizi del Sistema Data Analytics.

  2. Predizione sul dataset
    Esegue il metodo di predizione configurato (predict, predict_proba o altro) e aggiunge i risultati come nuove colonne al dataset.

  3. Generazione di grafici di supporto
    Se l’utente specifica il parametro prediction_type, vengono creati grafici che riassumono la distribuzione dei risultati:

  4. regressione → distribuzione dei valori previsti,
  5. classificazione binaria → distribuzione delle classi,
  6. classificazione multiclasse → distribuzione per classe,
  7. probabilità → distribuzione delle probabilità medie.

⚠️ I grafici sono costruiti solo sui valori di predizione ottenuti; il modello non viene interrogato ulteriormente.
Per questo motivo, il parametro prediction_type deve essere coerente con il predict_method selezionato.

  1. Registrazione del risultato
    Il dataset arricchito con le colonne di predizione viene salvato e reso disponibile come nuovo asset all’interno della pipeline del Sistema Data Analytics.

Parametri Configurabili

  • predict_method (opzionale, default: predict)
    Indica quale metodo del modello deve essere usato per calcolare le predizioni.
  • Esempio: predict per etichette discrete o valori numerici, predict_proba per probabilità.

  • feature_method (opzionale, default: nessuno)
    Permette di specificare un metodo o attributo del modello da cui estrarre i nomi delle feature attese.
    Utile per garantire l’allineamento corretto tra le colonne del dataset e il modello.
    Se non impostato, vengono usate direttamente le colonne del dataset.

  • prediction_type (opzionale, default: nessuno)
    Definisce il tipo di problema e di conseguenza i grafici da generare a partire dai risultati:

  • regression, binary, multiclass, proba.
    Deve essere coerente con il predict_method scelto.
    Se non impostato, il servizio esegue solo la predizione senza generare grafici.

Utilizzo del Servizio

  1. Selezionare un dataset di input e un modello compatibile (sklearn/MLflow).
  2. Configurare, se necessario, i parametri predict_method, feature_method e prediction_type.
  3. Avviare l’esecuzione.
  4. Ottenere come output un dataset arricchito con le predizioni, e se configurato, i grafici riassuntivi.

Vantaggi

  • Compatibilità diretta con i modelli generati nel Sistema Data Analytics (sklearn, MLflow).
  • Flessibilità nella scelta del metodo di predizione.
  • Supporto visivo per comprendere l’andamento dei risultati.
  • Automazione: il dataset arricchito è pronto per essere utilizzato in ulteriori analisi o pipeline.

Riferimenti Utili