Questo insegnamento intende fornire agli studenti la comprensione dei principali strumenti concettuali e computazionali riguardanti l'interpretazione di grandi quantià di dati a fini predittivi. L'insegnamento descriverà gli aspetti cruciali relativi all'elaborazione di dati di vario genere, estesi spazialmente e/o temporalmente, introdurrà la teoria della regolarizzazione alla base dei metodi di analisi dati sia in presenza che in assenza di un modello descrittivo qualitativo dei dati. Per lo sviluppo di questi concetti sono di fondamentale importanza il criterio statistico della massima verosimiglianza e l'approccio Bayesiano alla regolarizzazione. Inoltre, l'insegnamento inquadra le moderne tecniche di apprendimento da esempi - note come machine/deep learning - come particolari applicazioni della teoria statistica della regolarizzazione. L'approccio didattico combinerà gli aspetti teorici fondamentali con focus specifici su applicazioni in economia e in altre scienze applicate.
L'obiettivo generale di questo insegnamento è quello di fornire agli studenti le capacità di comprendere e utilizzare i principali strumenti, concettuali e computazionali, per l'interpretazione di grandi quantità di dati e per il loro utilizzo a fini predittivi.
L'obiettivo e' rendere gli studenti capaci di:
- comprendere dei dati di varia natura (per es. estesi temporalmente e/o spazialmente) come vettori / matrici. - elaborare dati tramite operazioni lineari e non lineari - comprendere e definire le relazioni tra dati come operazioni matematiche tra vettori - comprendere i modelli descrittive qualitative dei dati - comprendere l'ipostazione dell'apprendimento da esempi privo di modello qualitativo dei dati. - impostare problemi di ottimizzazione per determinare le soluzioni di problemi numerici proveneinti dal mondo reale, quali: - problemi di classificazione - problemi di regressione
Alla fine dell'insegnamento, gli studenti saranno in grado di orientarsi nel mondo dell'analisi computazionale dei dati e di comprendere alcuni aspetti dell'intelligenza artificiale. Inoltre avranno ottenuto una certa familiarità con gli strumenti computazionali per l'elaborazione dei dati a fini predittivi
Programmazione in Python
Formati dei dati e questioni di input/output
Aspetti di base dell'analisi numerica e della statistica (modelli lineari generalizzati).
Lezioni frontali (24 ore) ed esercitazioni al calcolatore (24 ore).
Analisi dati:
dati estesi teporalmente e spazialmente
modelli descrittivi dei dati
relazioni tra dati prive di modello
Predizione dai dati:
teoria della regolarizzazione
approccio bayesiano
reti neurali
deep learning
Dispense
Ricevimento: su appuntamento via email (piana@dima.unige.it)
Ricevimento: Tramite appuntamento per email.
FEDERICO BENVENUTO (Presidente)
MICHELE PIANA (Presidente)
CRISTINA CAMPI
SABRINA GUASTAVINO
Secondo semestre
Orale
Esame orale