Il corso consiste in una serie di attività collegate tra loro mirate ad introdurre temi generali legati all’area della Data Science e Data Engineering In particolare vedremo una panoramica legata alla costruzione di sistemi ed applicazioni informatiche per la raccolta, gestione, analisi e visualizzazione di dati. Ogni attività sarà costituita da alcune lezioni, seminari informativi e attività laboratoriale
Introduzione a strumenti utile nell'area della Data Science come Python e librerie collegate (itertools, numpy, scipy, ecc) ed esempi di applicazioni dell'informatica e della statistica all'analisi di dati
Il corso ha un molteplici obiettivo
- introdurre all'uso di strumenti molto usati nell'ambito della Data Science come il linguaggio Python, Jupyter Notebook, Google Colab, librerie di analisi e visualizzazione di dati e grafi;
- introdurre alcuni concetti e metodi comunemente usati per l'analisi di dati (PCA, clustering, time series, ecc)
- mostrare esempi e ambiti applicativi della data science attraverso seminari e laboratori
I risultati di apprendimento vengono valutati in base ad attività di laboratorio e presentazioni da parte degli studenti
Programmazione Matematica e statistica di base
Lezioni frontali Briefing su esercitazioni di laboratorio e soluzioni proposte dagli studenti Consegna di 5 esercitazioni proposte durante il corso e di un esercizio finale riepilogativo
Introduzione a Python
Costrutti
Immagini e matrici
Dizionari
Scoping e Classi
Ereditarietà ed Eccezioni
Pandas
Iteratori/generatori, map, reduce
Analisi di dati:
- itertools
- scipy
- pca
- regressione lineareNotebook Grafici e Regressione LineareURL
- clustering (combinazione KNN e PCA)
- time series
Data visualization:
- GeoPandas
- Plotly
Grafi con NetworkX
Introduzione a sistemi distribuiti, HPC e Big Data
Introduzione a Internet of Things/Edge Computing
Lucidi, lezioni registrate e note messe a dispozione dai docenti Introduzione alla Programmazione in Python - Apogeo Big Data Analysis - Apogeo
Ricevimento: Su appuntamento in presenza o Teams
GIORGIO DELZANNO (Presidente)
BARBARA CATANIA
GIOVANNA GUERRINI
NICOLETTA NOCETI
Febbraio 2021
L'esame consiste in un quiz online e una presentazione (in presenza o remoto) dei laboratori consegnati durante l'anno
La validazione dei quiz sarà automatica per le domande online e dai docenti per domande aperte e laboratori. Tale validazione è mirata a valutare l'apprendimento da parte dello studente di concetti e strumenti descritti nel corso.