L'insegnamento introduce le competenze alla base dell'analisi di dati strutturati e della Business Intelligence (BI). Partendo dai principi di modellazione di dati strutturati a fini analitici, gli studenti svilupperanno una comprensione approfondita della progettazione di data warehouse e acquisiranno esperienza pratica di formulazione di interrogazioni di analisi OLAP in SQL. Verranno inoltre introdotti strumenti per la creazione di report e cruscotti e framework per l'analisi dei dati su larga scala. Nelle attività pratiche, gli studenti lavoreranno con grandi set di dati in un ambiente di data warehouse per progettare e popolare un data warehouse, interrogarlo e creare dashboard, utilizzando, oltre a server OLAP, strumenti dedicati a ETL e BI.
Poiché l'insegnamento viene tenuto in lingua inglese, si invita a visionare la scheda in inglese per ulteriori informazioni.
Apprendere i fondamenti teorici, metodologici e tecnologici della gestione e analisi dei dati nei sistemi di supporto decisionale, con particolare riferimento alle problematiche architetturali e di progettazione dei data warehouse, nonché agli elementi chiave dell'integrazione e governance dei dati, della qualità e pulizia dei dati, dei processi di Estrazione-Trasformazione-Caricamento (ETL), e all'uso dei data warehouse per la reportistica aziendale e l'elaborazione analitica online.
Alla fine del corso, lo studente/la studentessa sarà in grado di:
DESCRIVERE i principi dell'analisi dei dati e dell'analisi dei dati su larga scala
COMPRENDERE le differenze tra i sistemi di gestione dei dati (OLTP) e i sistemi di analisi dei dati (OLAP)
COMPRENDERE le differenze tra problematiche progettuali e metodologie per basi di dati e data warehouse
COMPRENDERE le principali problematiche legate alla qualità dei dati, all’integrazione dei dati, alla pulizia dei dati e alla governance dei dati
COMPRENDERE le principali problematiche nella progettazione di un data warehouse, con riferimento specifico alla progettazione concettuale, alla progettazione logica ROLAP, alla selezione delle viste, alla progettazione fisica e alla progettazione dei processi ETL
COMPRENDERE le principali problematiche nell’analisi dei dati su larga scala
COMPRENDERE l’utilizzo della precomputazione e delle viste materializzate nei data warehouse, e SELEZIONARE il set di viste più appropriato
COMPRENDERE i principali operatori OLAP e le estensioni SQL per esprimerli, e APPLICARLI per formulare interrogazioni analitiche
APPLICARE la metodologia per progettare un data warehouse, a partire dai dati operazionali e dalle domande di business, passando per la progettazione concettuale, logica, la selezione delle viste e la progettazione fisica
SELEZIONARE i sistemi e i linguaggi più adeguati per un determinato contesto di analisi
UTILIZZARE alcuni dei sistemi presentati per l’esplorazione dei dati, la riconciliazione dei dati, la memorizzazione in data warehouse, la reportistica e le interrogazioni OLAP
UTILIZZARE alcuni dei sistemi presentati per costruire un data warehouse a partire da un dataset operativo e per effettuare analisi complesse su di esso
Fondamenti dei modelli, linguaggi e sistemi di basi di dati:
Modello Entità-Relazione (concettuale) Modello Relazionale (logico) Normalizzazione degli schemi Algebra relazionale e SQL Indici Transazioni
Lezioni in aula, attività pratiche di laboratorio.
L'insegnamento presenterà le principali problematiche architetturali e progettuali legate alla gestione e all’analisi dei dati nei sistemi di supporto alle decisioni (data warehousing), mettendole a confronto con i sistemi transazionali tradizionali.
M. Golfarelli, S. Rizzi. Data Warehouse Design. Mc-Graw Hill 2009. R. Kimball, M. Ross. The Data Warehouse Toolkit. Wiley, 2013. C. Jensen, T. Bach Pedersen, C. Thomsen. Multidimensional Databases and Data Warehousing. Morgan&Claypool, 2010. A.Vaisman, E. Zimányi. Data Warehouse Systems: Design and Implementation. Springer, 2014
Ricevimento: GIOVANNA GUERRINI: Su appuntamento, via email o Microsoft Teams Stanza: Valle Puggia – 301
Ricevimento: Su appuntamento, via email o Microsoft Teams Stanza: Valle Puggia – 327
GIOVANNA GUERRINI (Presidente)
BARBARA CATANIA (Presidente Supplente)
In accordo con il calendario didattico approvato dal Consiglio dei Corsi di Studio in Informatica: https://corsi.unige.it/corsi/11964/studenti-orario
L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy
Esame scritto e orale.
I dettagli su come prepararsi all’esame e il livello di conoscenza richiesto per ciascun argomento saranno forniti durante le lezioni.
L’esame scritto consiste in un insieme di domande aperte e chiuse e di esercizi sui principali argomenti del corso: le domande aperte e chiuse hanno lo scopo di verificare la comprensione delle principali tematiche affrontate durante le lezioni, mentre gli esercizi servono a valutare la capacità di applicare le nozioni, i linguaggi e la metodologia, nonché a risolvere semplici problemi relativi alla modellazione e all’interrogazione dei dati in ambito data warehousing.
Le attività progettuali consistono nella progettazione e realizzazione di un data warehouse (back-end e front-end); la presentazione dell’attività svolta permette di verificare la capacità di utilizzare almeno un sistema per l’analisi di dati non banale e la capacità di comunicare in forma scritta i risultati dell’attività in modo chiaro e completo.
L’esame orale consiste nella presentazione delle soluzioni sviluppate dallo studente per le attività progettuali, con l’obiettivo di valutare il livello di conoscenza raggiunto e la capacità di comunicare in forma orale i risultati dell’attività in modo chiaro e completo.
Per ulteriori informazioni, consultare il modulo Aulaweb dell'insegnamento o contattare il docente.