CODICE | 52507 |
---|---|
ANNO ACCADEMICO | 2018/2019 |
CFU | 6 cfu al 3° anno di 8766 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI (L-35) GENOVA |
SETTORE SCIENTIFICO DISCIPLINARE | SECS-S/01 |
LINGUA | Italiano |
SEDE | GENOVA (STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI ) |
PERIODO | 2° Semestre |
MATERIALE DIDATTICO | AULAWEB |
Sviluppare la capacità di estrarre sapere e conoscenza da grandi quantità di dati, specificamente
Sviluppare la capacità di estrarre sapere e conoscenza da grandi quantità di dati.
Alla fine del corso lo studente
Lezioni in aula, sezioni in laboratorio
Prima parte: introduzione al data mining
Introduzione a Data Mining, Data Science e Big Data Analytics
Il processo di Data Mining - CRISP
Sette classi di Algoritmi
Supervised Learning – Classification
Unsupervised Learnimg – Clustering
Outliers detection
Regression
Reinforced Learning
Ranking
Deep Learning
I dieci algoritmi più utilizzati in data mining
Esempi utilizzando il software WEKA
Applicazioni al marketing, alla finanza, alla medicina
Big Data e Hadoop
Approccio NoSQL ai dati
Seconda parte: algoritmo di apprendimento automatico per il Data mining
Introduzione al Data Mining e Machine Learning
Richiami di inferenza statistica e tassonomia dei problemi di Data Mining.
Classificazione: Support Vector Machine lineare e non lineare
Esercitazione di laboratorio
Regressione: Support Vector Regression lineare e non lineare
Esercitazione di laboratorio
Clustering: K-Means (con estensione tramite kernel) e Spectral Clustering Esercitazione di laboratorio
Alberi di decisione
Il problema della selezione e validazione dei modelli: k-fold Cross Validation e Bootstrap
Ricevimento: Su appuntamento richiesto per email all’indirizzo riccomagno@dima.unige.it
FABRIZIO MALFANTI (Presidente)
EVA RICCOMAGNO (Presidente)
LUCA ONETO
Lezioni in aula, sezioni in laboratorio
In accordo con il calendario accademico approvato dal Consiglio di Corsi di Studi.
E' obbligatorio prenotarsi per sostenere l'esame.
L'esame della prima parte consiste nell'elaborazione, svolta in gruppo, di un progetto concordato con il docente e in una prova scritta con correzione commentata e possibilità di discussione.
L'esame della seconda parte consiste nella discussione orale di un caso di studio svolto in autonomia dallo studente e concordato con i docenti.
Il voto finale è calcolato come la media pesata dei due voti con peso il numero di crediti.
Durante l'esame verrà accertata la conoscenza, da parte dello studente, delle metodologie e delle tecniche per l'estrazione di conoscenza da grandi moli di dati attraverso un piccolo progetto monografico che prevede la soluzione di un problema reale di analisi dati.
Data | Ora | Luogo | Tipologia | Note |
---|---|---|---|---|
21/01/2019 | 09:00 | GENOVA | registrazione | per gli studenti iscritti all'insegnamento nell'a.a.2017/18 e precedenti |
30/05/2019 | 09:00 | GENOVA | Laboratorio | |
20/06/2019 | 09:00 | GENOVA | Laboratorio | |
23/07/2019 | 09:00 | GENOVA | Laboratorio |
La pagina web della seconda parte del corso è disponibile al link https://sites.google.com/view/lucaoneto/teaching/dm-smid
Su appuntamento richiesto per email agli indirizzi Luca Oneto <luca.oneto@unige.it>, Fabrizio Malfanti fabrizio.malfanti@intelligrate.it
Per questioni organizzative contattare via email Eva Riccomagno <riccomagno@dima.unige.it>