L'insegnamento di Statistical models intende fornire gli elementi fondamentali dell’analisi statistica inferenziale, dall’inferenza classica tramite verosimiglianza all’analisi dei modelli di regressione e classificazione, per le applicazioni in campo economico e sociale.
Lo scopo dell’insegnamento di “Statistical models” è quello di presentare alcune tecniche fondamentali della statistica (stima basata sulla verosimiglianza, metodi di regressione e classificazione, processi markoviani) in modo che lo studente sia in grado di comprendere le tecniche presentate sia a livello teorico che pratico, e di analizzare criticamente l’utilizzo di tali tecniche in contesti applicativi.
L’insegnamento è articolato in tre parti:
Tutti gli agomenti saranno accompagnati da esercizi pratici in R, in modo che lo studente possa affiancare alla comprensione degli argomenti trattati anche la capacita' di applicare corrette analisi statistiche in contesti reali e di comprendere gli output delle procedure statistiche.
Conoscenza e comprensione: Gli studenti dovranno conoscere le principali tecniche e i principali strumenti per la statistica inferenziale. Dovranno essere in grado di inquadrare tali strumenti in termini generali (sia teorici che applicati), e di analizzarne gli strumenti matematici e statistici sottostanti.
Capacità di applicare conoscenza e comprensione: Gli studenti saranno in grado di individuare, di fronte a problemi applicati in diversi contesti, la corretta tecnica di analisi. Inoltre, saranno in grado di valutare cirticamente i risultati ottenuti tramite software statistico.
Autonomia di giudizio: Gli studenti dovranno acquisire consapevolezza delle potenzialità e dei limiti delle tecniche statistiche presentate, attraverso l’analisi di esempi e studio di casi.
Abilità comunicative: Gli studenti dovranno saper utilizzare il linguaggio tecnico-statistico corretto per la comunicazione dei risultati e per la descrizione delle tecniche utilizzate.
Capacità di apprendimento: Gli studenti svilupperanno adeguate capacità di apprendimento che consentano loro di continuare ad approfondire in modo autonomo altri aspetti della materia e diversi campi di applicazione rispetto a quelli illustrati. Inoltre, dovranno poter utilizzare anche autonomamente il software R.
I contenuti tipici di un corso introduttivo di Statistica per lauree triennali.
Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio.
1. Introduzione ai modelli statistici.
2. Le principali famiglie di distribuzioni discrete.
3. Le principali famiglie di distribuzioni continue.
4. Distribuzioni multivariate. Distribuzioni condizionate e speranza condizionata.
5. Simulazione. Misture e stime di densita'.
6. Verosimiglianza e sufficienza. Stima per massima verosimiglianza. Informazione.
7. La famiglia esponenziale.
8. Richiami sul modello lineare multiplo.
9. Modelli lineari generalizzati. Regressione logistica e di Poisson. Analisi discriminante.
10. Metodi di selezione del modello e regolarizzazione.
11. Regressione tramite splines.
12. Catene di Markov. Probabilita' di transizione. Ricorrenza e transienza.
13. Legge invariante e convergenza.
14. Problemi di tempo di primo passaggio e simulazione.
Mood AM, Graybill FA and Boes DC, Introduction to the theory of statistics, 3rd edition (disponibile su Aulaweb).
James G, Witten D, Hastie T and Tibshirani R, An Introduction to Statistical Learning. With Applications in R. Springer (disponibile sulla webpage degli autori).
Inoltre:
Casella G and Berger RL, Statistical Inference. Duxbury
Efron B and Hastie T, Computer Age Statistical Inference. Algorithms, Evidence, and Data Science. Stanford University (disponibile sulla webpage degli autori).
Versione italiana del primo testo: Mood AM, Graybill FA and Boes DC, Introduzione alla statistica, Mc-Graw Hill.
Materiali aggiuntivi (sia in Italiano che in Inglese) saranno resi disponibili su Aulaweb a cura del docente.
Ricevimento: Ricevimento studenti secondo semestre: Lunedi ore 14-16:30. Si ricorda che è OBBLIGATORIA la prenotazione. NOTA 1 : Il ricevimento di lunedi 17 maggio 2021 è spostato a martedi 18, stesso orario. NOTA 2 : Il ricevimento di lunedi 24 maggio 2021 è annullato causa concomitante preappello.
FABIO RAPALLO (Presidente)
CORRADO LAGAZIO
LUCA PERSICO
Inizio lezioni: 15 febbraio 2021
STATISTICAL MODELS
Qualora l'andamento dell'epidemia COVID consenta gli esami in presenza, l’esame consisterà in una prova scritta, che potrà essere sostituita – per i frequentanti – da tre prove intermedie da svolgersi durante il corso. In caso di esami in remoto, se possibile si manterrà la stessa struttura di esami scritti in remoto con caricamento dell'esame manoscritto. Il regolamento completo d’esame sarà pubblicato sulla pagina del corso su Aulaweb e tenuto aggiornato in base alle disposizioni normative e regolamentari che via via dovranno esser rispettate.
L'esame scritto si compone di tre parti:
1) una domanda di carattere generale a risposta aperta
2) una o più domande specifiche a risposta aperta
3) un output da commentare
Le domande sono scelte in modo da coprire, per quanto possibile, tutti gli argomenti del programma d'esame. La domanda generale ha lo scopo di valutare il grado di conoscenza della materia e l’acquisizione del linguaggio tecnico corretto, le domande specifiche sono tese a valutare la capacità critica dello studente, mentre il commento all’output serve a valutarne le capacità di applicazione.
L'eventuale esame orale - in caso di esami in remoto - avrà la stessa struttura dell'esame scritto.