Dati e gestione

L’attività mira allo sviluppo di una soluzione per collezionare e valutare la qualità dei dati in ingresso in modo indipendente dalla finalità e peculiarità del dato stesso.

L’attività sperimentale

Sviluppo e realizzazione di una metodologia che permette di  implementare best practice sui dati ingresso in fase di ingestione e pre-processing. Ad esempio permette di anonimizzare o offuscare, quantizzare dati sensibili Permette anche di clusterizzare, etichettare e normalizzare dati prima che vengano analizzati.

La metodologia sviluppata offre la possibilità di tenere traccia della qualità del dato durante tutto il processo di analisi, producendo un data lineage avanzato utile per tracciare l’uso dei dati in piattaforma.

Risultati e prospettive

L’architettura di gestione dati è anche percolata ed evoluta all’interno del PNRR MUSA che costituisce una architettura più generica rispetta a quella di H1_HUB e ne integra e ne estende tutte le caratteristiche principali.

Riferimenti bibliografici

  • Polimeno, A., Mignone, P., Braghin, C., Anisetti, M., Ceci, M., Malerba, D., & Ardagna, C. A. (2025). Balancing Protection and Quality in Big Data Analytics Pipelines. Big Data, 13(2), 127-143.
  • Polimeno, A., Braghin, C., Anisetti, M., & Ardagna, C. A. (2025). Maximizing data quality while ensuring data protection in service-based data pipelines. Journal of Big Data, 12(1), 62.