Manuale d’Uso del Servizio Shift Target Column
Introduzione
Il servizio Shift Target Column permette di preparare un dataset per applicazioni di forecasting su serie temporali.
L’operazione consiste nello “shiftare” una o più colonne target di un certo numero di passi temporali (hop), così da generare il dataset necessario per addestrare modelli predittivi.
Funzionalità del Servizio
-
Gestione dataset registrati nel Sistema Data Analytics
L’input è un dataset già registrato nel Sistema Data Analytics con storage MinIO. -
Shift delle colonne target
Le colonne target selezionate vengono spostate di un numero di passi (hop) definito dall’utente. -
Modalità di output flessibili
- Aggiunta di nuove colonne shiftate con suffisso (
_shifted), -
Oppure sostituzione delle colonne originali con le versioni shiftate.
-
Supporto a stratificazione e ordinamento
È possibile applicare lo shift: - separatamente per i gruppi definiti da una colonna di selezione,
-
dopo aver ordinato il dataset in base a una colonna di ordinamento.
-
Output come dataset MinIO
Il risultato è salvato su MinIO e registrato automaticamente come nuovo dataset utilizzabile nelle pipeline. -
Messaggi di avanzamento
Durante l’elaborazione il servizio invia messaggi di log per monitorare lo stato dell’operazione.
Utilizzo del Servizio
Configurazione
Nell’interfaccia utente vanno configurati:
- Input dataset: un dataset registrato con storage MinIO,
- Hop size: numero di passi temporali per lo shift (≥1),
- Target columns: elenco di colonne target da shiftare (separate da virgola),
- (Opzionale) Selecting column: colonna per stratificare il processo,
- (Opzionale) Sorting column: colonna per ordinare i dati prima di applicare lo shift,
- (Opzionale) Replace target columns: se attivo, le colonne originali vengono sostituite; altrimenti vengono aggiunte nuove colonne _shifted.
Esecuzione
Al RUN del servizio:
1. Il dataset di input viene letto da MinIO,
2. Viene applicata la trasformazione di shift alle colonne target,
3. Le ultime righe incomplete (pari all’hop size) vengono rimosse,
4. Il dataset trasformato viene salvato su MinIO come output.
Output
Il risultato è un dataset contenente le nuove colonne shiftate (o sostituite), pronto per essere utilizzato in modelli di forecasting.
Vantaggi
- Preparazione automatizzata: non è necessario scrivere codice per generare dataset shiftati.
- Flessibilità: supporta aggiunta o sostituzione delle colonne target.
- Compatibilità con forecasting: i dataset risultanti sono pronti per essere utilizzati con modelli predittivi su serie temporali.
- Integrazione con pipeline: input e output gestiti tramite dataset MinIO.