Salta al contenuto principale
CODICE 52509
ANNO ACCADEMICO 2016/2017
CFU
SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01
SEDE
PERIODO 2° Semestre
MATERIALE DIDATTICO AULAWEB

PRESENTAZIONE

 

Esperti introducono o approfondiscono tecniche statistiche che utilizzano nel loro lavoro illustrandone la applicazione tramite esempi concreti. 

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

Obiettivo del corso e' fornire alcuni strumenti statistici legati a specifiche applicazioni.

OBIETTIVI FORMATIVI (DETTAGLIO)

Ennio Ottaviani Il corso introduce i concetti fondamentali e gli algoritmi del Pattern Recognition statistico, presentati un’ottica legata alle applicazioni industriali (es. manutenzione predittiva, ottimizzazione dei processi, controllo di qualità, etc.), al loro ciclo di sviluppo ed alla valutazione delle prestazioni. Particolare enfasi viene posta sulle connessioni con il mondo della Computer Vision, che costituisce spesso la sorgente di dati su cui le metodologie di Pattern Recognition vanno ad operare. La materia viene presentata a partire della teoria statistica della decisione e della stima parametrica, offrendo poi in rapida successione diversi punti di vista e diversi approcci concettuali con cui è possibile affrontare il problema, ma sempre con un comune riferimento nella capacità di realizzare sistemi industriali in grado di prendere in modo autonomo decisioni statisticamente ottimali sulla base dell’esperienza. Grazie al piano Industria 4.0 che dovrebbe portare ad un forte rinnovamento nei processi produttivi, si ritiene utile dare una visibilità maggiore di questo settore di impiego delle competenze statistiche.


Carlo Chiorri  Modelli di misurazione in psicometria  
Il modulo presenta un'Introduzione alla teoria della psicometria per statistici e fornisce gli strumenti anche informatici (software R) per eseguire semplici analisi. 

Gianpiero Dalla Zuanna Comunicare dati demografici al cittadino medio. Un esempio.  

MODALITA' DIDATTICHE

Lezioni in aula e laboratorio

PROGRAMMA/CONTENUTO

Pattern recognition e applicazioni

A valle di una panoramica iniziale sul problema del riconoscimento automatico e sui criteri di base con cui vengono realizzate le applicazioni, verranno affrontati in particolare i seguenti argomenti:

  • Teoria bayesiana della decisione. Principio della massima probabilità a posteriori. Classificazione e regressione. Approccio Naive Bayes. Costruzione del classificatore ottimale. Stima dei parametri. Valutazione oggettiva delle prestazioni. Cross-validation.
  • Classificatori statistici di tipo generale. Misture gaussiane ed algoritmo EM. Outlier detection. Alcune semplici tecniche non parametriche. Introduzione alle reti bayesiane per l’inferenza su grafi.
  • Riduzione della dimensionalità. Selezione di features. Approccio genetico. Trasformazioni lineari dello spazio: PCA/LDA/ICA. Mapping non lineari (t-SNE).
  • Approcci ad albero di decisione. La tecniche costruttiva CART. Bagging e random forest. Il boosting e le sue principali realizzazioni. Modellazione statistica di sistemi mediante alberi.
  • Reti neurali per la classificazione. Modelli multistrato ed algoritmi di apprendimento. Criteri di progetto di un classificatore neurale. Reti neurali come approssimatori generalizzati. Introduzione al deep learning (reti convolutive e stacked autoencoders)

Le lezioni teoriche sono intervallate da alcuni esempi di applicazioni discussi in dettaglio, quali:

  • Sistemi di lettura automatica in ambienti non controllati (OCR). Costruzione di classificatori a diverso livello di complessità (da Naive Bayes alle reti convolutive) per il riconoscimento di caratteri alfanumerici.
  • Sistemi automatici di conteggio e di rilevamento eventi . Analisi di immagini per definire la presenza di volti, persone, veicoli, etc. Estrazione di alcuni feature set e definizione di un test binario ottimale di accettazione mediante boosting.
  • Modellazione statistica di un macchinario complesso. Definizione di una relazione non lineare di ingresso-uscita per la previsione di una variabile target (es. consumo energetico) a partire dai dati strumentali di un impianto/processo, con l'uso di modelli random forest e neurali.
  • Controllo di qualità della produzione e manutenzione predittiva. Analisi della distribuzione probabilistica di dati sensoriali ed identificazione anomalie (outlier detection). Stima del tempo di vita residuo (TTF) del sistema.

Per tali applicazioni saranno disponibili moduli Matlab e dati originali su cui gli studenti potranno operare direttamente durante esercitazioni guidate.


Psicometria

La teoria classica dei test
Le variabili psicologiche o costrutti
Definizione del dominio di contenuto del costrutto e delle sue
operazionalizzazioni
Modelli di misurazione in psicologia ad indicatori riflessivi e
formativi
Analisi degli item e attendibilità
Analisi fattoriale esplorativa
Analisi fattoriale confermativa
Modelli di equazioni strutturali
I modelli di Rasch (se rimane tempo)

Verranno mostrati esempi di analisi con R (packages 'psych', 'lavaan' e 'semPlot')

 

Demografia

la fonte statistica, la popolazione su cui e' stato raccolto il dato e la popolazine di riferimento (coincidono?), come il dato e' tradotto in informazione e come l'informazione statistica e' comunicata (quali sono i limiti dell'informazione desuta?), quali sono i valori aggregati (=statistiche) scelti e come sono stati scelti, le tecniche statistiche adottate, etc etc etc  La lettura ed analisi fatte in autonomia del volume Tutto quello che non vi hanno mai detto sull'immigrazione (2015, Laterza) di Gianpiero Dalla Zuanna e Stefano Allievi, saranno confrontate in lezioni in presenza.

TESTI/BIBLIOGRAFIA

OCR
Materiale fornito dal docente e disponibile al sito http://www.onairweb.com/corsoPR/
Per approfodimenti 
R.Duda, P.Hart, D.Stork, Pattern Classifcation, Wiley, (2001)
S.Theodoridis, K.Koutroumbas, Pattern Recognition, Academic Press, (2006)
C.Bishop, Pattern Recognition and Machine Learning, Springer, (2007)

Psicometria
Chiorri, C. (2011). Teoria e tecnica psicometrica. Milano: McGraw-Hill (capitoli 1, 2, 4 e 5).
Materiale: BFA.csvBFA.pdfLezioni SMID_2x.pdfLezioni SMID_6x.pdfLezioni SMID.pdfLezioni SMID.r 
Il materiale che verrà utilizzato si trova su https://www.dropbox.com/s/groq642v7rbviha/Lezioni%20SMID%202016.zip?dl=0

Demografia
Gianpiero Dalla Zuanna e Stefano Allievi (2015). Tutto quello che non vi hanno mai detto sull'immigrazione, Laterza.

DOCENTI E COMMISSIONI

Commissione d'esame

EVA RICCOMAGNO (Presidente)

MARIA PIERA ROGANTIN (Presidente)

LEZIONI

INIZIO LEZIONI

20 Febbraio 2017

Orari delle lezioni

STATISTICA APPLICATA 2

ESAMI

MODALITA' D'ESAME

OCR
Questionario a risposta multipla

Psicometria
Scritto e discussione orale

Demografia
Questionario con risposta a crocette

Calendario appelli

Data appello Orario Luogo Tipologia Note
17/05/2017 09:00 GENOVA Laboratorio
17/05/2017 09:00 GENOVA Orale
17/05/2017 09:00 GENOVA Scritto
07/06/2017 09:00 GENOVA Laboratorio
07/06/2017 09:00 GENOVA Orale
07/06/2017 09:00 GENOVA Scritto
05/07/2017 09:00 GENOVA Laboratorio
05/07/2017 09:00 GENOVA Orale
05/07/2017 09:00 GENOVA Scritto

ALTRE INFORMAZIONI

Pagina web dell'insegnamento: http://fermat.dima.unige.it/~riccomag/Teaching/StatisticaApplicata2.html

Prerequisiti: Statistica Applicata 1

L’attività formativa, avendo un carattere prevalentemente seminariale e prevedendo anche docenti esterni, è rivolta a quegli studenti che possono frequentare regolarmente le lezioni.

 

Ricevimento studenti: Il dottor Ottaviani ed il professor Dalla Zuanna sono contattabili via email per prendere appuntamento.