CODICE 52509 ANNO ACCADEMICO 2016/2017 CFU 6 cfu anno 3 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (L-35) - SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01 SEDE PERIODO 2° Semestre MATERIALE DIDATTICO AULAWEB PRESENTAZIONE Esperti introducono o approfondiscono tecniche statistiche che utilizzano nel loro lavoro illustrandone la applicazione tramite esempi concreti. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI Obiettivo del corso e' fornire alcuni strumenti statistici legati a specifiche applicazioni. OBIETTIVI FORMATIVI (DETTAGLIO) Ennio Ottaviani Il corso introduce i concetti fondamentali e gli algoritmi del Pattern Recognition statistico, presentati un’ottica legata alle applicazioni industriali (es. manutenzione predittiva, ottimizzazione dei processi, controllo di qualità, etc.), al loro ciclo di sviluppo ed alla valutazione delle prestazioni. Particolare enfasi viene posta sulle connessioni con il mondo della Computer Vision, che costituisce spesso la sorgente di dati su cui le metodologie di Pattern Recognition vanno ad operare. La materia viene presentata a partire della teoria statistica della decisione e della stima parametrica, offrendo poi in rapida successione diversi punti di vista e diversi approcci concettuali con cui è possibile affrontare il problema, ma sempre con un comune riferimento nella capacità di realizzare sistemi industriali in grado di prendere in modo autonomo decisioni statisticamente ottimali sulla base dell’esperienza. Grazie al piano Industria 4.0 che dovrebbe portare ad un forte rinnovamento nei processi produttivi, si ritiene utile dare una visibilità maggiore di questo settore di impiego delle competenze statistiche. Carlo Chiorri Modelli di misurazione in psicometria Il modulo presenta un'Introduzione alla teoria della psicometria per statistici e fornisce gli strumenti anche informatici (software R) per eseguire semplici analisi. Gianpiero Dalla Zuanna Comunicare dati demografici al cittadino medio. Un esempio. MODALITA' DIDATTICHE Lezioni in aula e laboratorio PROGRAMMA/CONTENUTO Pattern recognition e applicazioni A valle di una panoramica iniziale sul problema del riconoscimento automatico e sui criteri di base con cui vengono realizzate le applicazioni, verranno affrontati in particolare i seguenti argomenti: Teoria bayesiana della decisione. Principio della massima probabilità a posteriori. Classificazione e regressione. Approccio Naive Bayes. Costruzione del classificatore ottimale. Stima dei parametri. Valutazione oggettiva delle prestazioni. Cross-validation. Classificatori statistici di tipo generale. Misture gaussiane ed algoritmo EM. Outlier detection. Alcune semplici tecniche non parametriche. Introduzione alle reti bayesiane per l’inferenza su grafi. Riduzione della dimensionalità. Selezione di features. Approccio genetico. Trasformazioni lineari dello spazio: PCA/LDA/ICA. Mapping non lineari (t-SNE). Approcci ad albero di decisione. La tecniche costruttiva CART. Bagging e random forest. Il boosting e le sue principali realizzazioni. Modellazione statistica di sistemi mediante alberi. Reti neurali per la classificazione. Modelli multistrato ed algoritmi di apprendimento. Criteri di progetto di un classificatore neurale. Reti neurali come approssimatori generalizzati. Introduzione al deep learning (reti convolutive e stacked autoencoders) Le lezioni teoriche sono intervallate da alcuni esempi di applicazioni discussi in dettaglio, quali: Sistemi di lettura automatica in ambienti non controllati (OCR). Costruzione di classificatori a diverso livello di complessità (da Naive Bayes alle reti convolutive) per il riconoscimento di caratteri alfanumerici. Sistemi automatici di conteggio e di rilevamento eventi . Analisi di immagini per definire la presenza di volti, persone, veicoli, etc. Estrazione di alcuni feature set e definizione di un test binario ottimale di accettazione mediante boosting. Modellazione statistica di un macchinario complesso. Definizione di una relazione non lineare di ingresso-uscita per la previsione di una variabile target (es. consumo energetico) a partire dai dati strumentali di un impianto/processo, con l'uso di modelli random forest e neurali. Controllo di qualità della produzione e manutenzione predittiva. Analisi della distribuzione probabilistica di dati sensoriali ed identificazione anomalie (outlier detection). Stima del tempo di vita residuo (TTF) del sistema. Per tali applicazioni saranno disponibili moduli Matlab e dati originali su cui gli studenti potranno operare direttamente durante esercitazioni guidate. Psicometria La teoria classica dei test Le variabili psicologiche o costrutti Definizione del dominio di contenuto del costrutto e delle sue operazionalizzazioni Modelli di misurazione in psicologia ad indicatori riflessivi e formativi Analisi degli item e attendibilità Analisi fattoriale esplorativa Analisi fattoriale confermativa Modelli di equazioni strutturali I modelli di Rasch (se rimane tempo) Verranno mostrati esempi di analisi con R (packages 'psych', 'lavaan' e 'semPlot') Demografia la fonte statistica, la popolazione su cui e' stato raccolto il dato e la popolazine di riferimento (coincidono?), come il dato e' tradotto in informazione e come l'informazione statistica e' comunicata (quali sono i limiti dell'informazione desuta?), quali sono i valori aggregati (=statistiche) scelti e come sono stati scelti, le tecniche statistiche adottate, etc etc etc La lettura ed analisi fatte in autonomia del volume Tutto quello che non vi hanno mai detto sull'immigrazione (2015, Laterza) di Gianpiero Dalla Zuanna e Stefano Allievi, saranno confrontate in lezioni in presenza. TESTI/BIBLIOGRAFIA OCR Materiale fornito dal docente e disponibile al sito http://www.onairweb.com/corsoPR/ Per approfodimenti R.Duda, P.Hart, D.Stork, Pattern Classifcation, Wiley, (2001) S.Theodoridis, K.Koutroumbas, Pattern Recognition, Academic Press, (2006) C.Bishop, Pattern Recognition and Machine Learning, Springer, (2007) Psicometria Chiorri, C. (2011). Teoria e tecnica psicometrica. Milano: McGraw-Hill (capitoli 1, 2, 4 e 5). Materiale: BFA.csv, BFA.pdf, Lezioni SMID_2x.pdf, Lezioni SMID_6x.pdf, Lezioni SMID.pdf, Lezioni SMID.r Il materiale che verrà utilizzato si trova su https://www.dropbox.com/s/groq642v7rbviha/Lezioni%20SMID%202016.zip?dl=0 Demografia Gianpiero Dalla Zuanna e Stefano Allievi (2015). Tutto quello che non vi hanno mai detto sull'immigrazione, Laterza. DOCENTI E COMMISSIONI EVA RICCOMAGNO Ricevimento: Su appuntamento richiesto per email agli indirizzi Luca Oneto <luca.oneto@unige.it>, Fabrizio Malfanti fabrizio.malfanti@intelligrate.it Per questioni organizzative contattare via email Eva Riccomagno <riccomagno@dima.unige.it> CARLO CHIORRI Ricevimento: Di persona: martedì, ore 12-13, Facoltà di Scienze della Formazione, Sezione di Psicologia, piano IV, stanza 4A3, Corso Podestà, 2, 16128 Genova. Eventuali assenze del docente sono comunicate sul sito Aulaweb del corso. Il docente garantisce la propria disponibilità senza appuntamento solo nell'orario descritto sopra. E' possibile concordare via e-mail appuntamenti per incontri in altri giorni e/o orari, ma si tenga presente che il docente non garantisce la propria disponibilità a chi si presenta senza appuntamento fuori dell'orario ufficiale. Sempre mediante appuntamento il docente è disponibile ad incontrare gli studenti tramite Skype (contatto: chiorri.psicometria). Contatti del docente Telefono 010 209 53709 E-mail: carlo.chiorri[chioc]unige.it oppure carlo.chiorri[chioc]gmail.com Skype: chiorri.psicometria (solo su appuntamento) ENNIO OTTAVIANI Commissione d'esame EVA RICCOMAGNO (Presidente) MARIA PIERA ROGANTIN (Presidente) LEZIONI INIZIO LEZIONI 20 Febbraio 2017 Orari delle lezioni STATISTICA APPLICATA 2 ESAMI MODALITA' D'ESAME OCR Questionario a risposta multipla Psicometria Scritto e discussione orale Demografia Questionario con risposta a crocette Calendario appelli Data appello Orario Luogo Tipologia Note 17/05/2017 09:00 GENOVA Laboratorio 17/05/2017 09:00 GENOVA Orale 17/05/2017 09:00 GENOVA Scritto 07/06/2017 09:00 GENOVA Laboratorio 07/06/2017 09:00 GENOVA Orale 07/06/2017 09:00 GENOVA Scritto 05/07/2017 09:00 GENOVA Laboratorio 05/07/2017 09:00 GENOVA Orale 05/07/2017 09:00 GENOVA Scritto ALTRE INFORMAZIONI Pagina web dell'insegnamento: http://fermat.dima.unige.it/~riccomag/Teaching/StatisticaApplicata2.html Prerequisiti: Statistica Applicata 1 L’attività formativa, avendo un carattere prevalentemente seminariale e prevedendo anche docenti esterni, è rivolta a quegli studenti che possono frequentare regolarmente le lezioni. Ricevimento studenti: Il dottor Ottaviani ed il professor Dalla Zuanna sono contattabili via email per prendere appuntamento.