Vai al contenuto

Primi Passi | tutorial-label

Nel seguente tutorial creerai un semplice Workflow per familiarizzare con il Sistema Data Analytics. In particolare:

  • Caricherai un nuovo Dataset
  • Creerai un Workflow che leggerà il Dataset ed applicherà ad esso l'algoritmo K-means
  • Eseguirai il Workflow
  • Visualizzerai i risultati ottenuti

1. Login

Per prima cosa effettua il login con le credenziali che ti sono state fornite dall'amministratore

2. Caricamento Dataset

Procedi quindi al caricamento del Dataset. Nel Sistema Data Analytics, un Dataset è un riferimento ad una specifica posizione all'interno di una Datasource (es. "bucket/prefisso" nel caso di un Object Store MinIO).

2.1 Scarica sul tuo computer il dataset Iris

Scarica in formato CSV dal seguente URL:

2.2 Accedi alla pagina di registrazione Dataset

come indicato dalle seguenti figure:

dashboard with burger icon highlighted

Accedi al menu laterale attraverso l'icona burger

sidebar with datasets highlighted

Apri il pannello Datasets

datasets page

Apri form registrazione dataset

2.3 Riempi il form come di seguito indicato (vedi anche figure):

  1. Name: Quickstart Iris
  2. Seleziona la Datasource all'interno della quale caricare il dataset: <tuo nome utente>
  3. Apri il pannello di caricamento Dataset cliccando sul pulsante upload-dataset-button

    dataset registration form with first steps highlighted

    Form registrazione Dataset

  4. Nel pannello apertosi, inserisci il nome della nuova cartella da creare: Quickstart Iris (il file caricato verrà salvato all'interno di essa)

  5. Carica il dataset Iris scaricato al passo 2.1 cliccando sull'area "Drop files or folders here"

    upload dataset dialog

    Pannello caricamento dataset

    file-successfully-uploaded-popup

  6. Clicca sulla directory appena creata

    select-just-uploaded-directory

  7. Seleziona il percorso del dataset cliccando sull'icona register-dataset-select-dataset-path-icon-button come indicato in figura:

    load-just-uploaded-file-path

    Al click, in basso sulla stessa pagina, verrà mostrato lo schema del Dataset selezionato.

    register-dataset-schema-details-after-dataset-path-selection

  8. Clicca su Save. Comparirà la pagina di dettaglio per il Dataset appena creato

    dataset-details-page-after-upload

3. Creazione Workflow

3.1 Accesso al Workflow Designer

A questo punto, accedi al Designer per la creazione del Workflow come mostrato nelle seguenti figure:

sidebar-menu-with-workflows-item-highlighted

Accedi al catalogo dei Workflow

create-workflow-button-highlighted

Crea nuovo Workflow

3.2 Configura il Workflow

Riempi il form impostazioni Workflow come indicato in figura:

  • Access Level: Private
  • Default Data Source: <tua.utenza>

e clicca su Conferma:

new-workflow-pre-settings.png

Pannello impostazioni Workflow

Hai raggiunto il Workflow Designer, che ti permetterà di combinare Dataset, Service e Model per creare il tuo Workflow:

workflow-designer-first-view

3.4 Assembla il Workflow

Trascina quanto segue sul canvas del Designer

  1. Il Service KMeans
  2. Il Dataset Iris precedentemente caricato (sotto tab Datasets)

service-drag-n-drop

3.5 Connetti i componenti

Collega il Dataset "Quickstart Iris" al Service "KMeans", trascinando la porta del Dataset (🟢) e rilasciandola su quella di ingresso del Service (🟢):

connecting-service-ports

3.6 Assegna un nome al Workflow

dal menù di destra: Quickstart Iris, assegna un nome al Workflow

workflow-designer-assign-name-to-workflow

3.7 Seleziona il Target

Clicca sul Service KMean sul canvas e seleziona il Target di default "Worker Nodes": select-default-target-in-workflow Il Target determina l'insieme dei nodi del cluster candidati ad ospitare l'esecuzione del Service

3.8 Salva Workflow

Infine, clicca su un punto vuoto del canvas e poi su Crea Workflow: save-workflow.png

Nota

All'interno di questo breve tutorial non trattiamo le numerose funzionalità di configurazione del Workflow e dei singoli Service offerte dal Sistema Data Analytics. Per queste, rimandiamo il lettore alle rispettive sezioni del presente manuale.

4. Esecuzione del Workflow

4.1 Esegui il Workflow

Dopo aver creato il Workflow, nella risultante pagina di dettaglio, clicca su Run per eseguirlo:

click-on-run-workflow

4.2 Status del Workflow

Al termine dell'esecuzione, la barra di stato passerà automaticamente a Completed:

completed-workflow-status-bar

5. Visualizzazione dei Risultati

Il Service Kmeans in uso, genera due tipologie di output:

  1. Un set di grafici
  2. Un dataset che differisce da quello in input per l'aggiunta di una nuova colonna contenente il risultato della classificazione

5.1 Visualizza i grafici del risultato

Rimanendo sulla pagina di dettaglio del Workflow, visualizza i grafici cliccando su Workflow Media:

application-media-button-highlighted

Sulla destra si aprirà un pannello con i grafici generati dal Workflow:

kmeans-sample-plots

5.2 Visualizza il dataset in output

  1. Scorri verso il basso la pagina corrente di dettaglio del Workflow
  2. Apri la sezione Datasets, e
  3. Clicca sul pulsante Preview (plain-preview-button) accanto al Dataset in output (output-dataset-tag-icon)

output-dataset-view-area.png

Si aprirà un dialog, con l'anteprima del Dataset risultante. Notare la nuova colonna cluster contenente i risultati dell'elaborazione. output-dataset-data-preview-popup.png

6. Prossimi Passi

Congratulazioni! Hai appena creato ed eseguito il tuo primo Workflow.

Prosegui approfondendo i concetti e le funzionalità del Sistema Data Analytics:

  • Visita la sezione La Piattaforma per esplorare l'interfaccia grafica del Sistema Data Analytics
  • Visita la sezione Asset per saperne di più sui componenti essenziali del Sistema Data Analytics
  • Visita la sezione Service e il tutorial sulla creazione di Service personalizzati