CODICE 52503 ANNO ACCADEMICO 2017/2018 CFU 7 cfu anno 1 MATEMATICA 9011 (LM-40) - 7 cfu anno 2 MATEMATICA 9011 (LM-40) - 11 cfu anno 3 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (L-35) - SETTORE SCIENTIFICO DISCIPLINARE MAT/06 LINGUA Italiano (Inglese a richiesta) SEDE PERIODO 1° Semestre PROPEDEUTICITA Propedeuticità in ingresso Per sostenere l'esame di questo insegnamento è necessario aver sostenuto i seguenti esami: STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (coorte 2015/2016) PROBABILITA' 87081 2015 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (coorte 2017/2018) PROBABILITA' 87081 2017 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (coorte 2016/2017) PROBABILITA' 87081 2016 MATERIALE DIDATTICO AULAWEB PRESENTAZIONE L'insegnamento introduce le definizioni ed i concetti principali della statistica matematica classica, dalle nozioni di modello statistico e stimatore puntuale a vari metodi di stima (dei momenti, in verosimiglianza, principio di invarianza) e di valutazione di bontà di uno stimatore. Tutto ciò è applicato nella seconda parte ad una classe di modelli molto fontamentale per le applicazioni, alcune delle quali sono illustrate con lezioni in laboratorio e l'utilizzo del software SAS. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI Inquadrare i problemi di stima parametrica e non parametrica e di verifica delle ipotesi in un contesto rigoroso dal punto di vista matematico. Approfondire lo studio dell’ampia classe dei modelli lineari usando i metodi della statistica matematica. OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO Alla fine del corso lo studente saprà riconoscere i problemi di stima parametri e non parametrica in contesti applicativi formularli rigorosamente da un punto di vista matematico individuare se un modello di regressione è adatto per l'analisi del dato, svolgere l'analisi con software opportuno, sintetizzare i risultati in un report semi-professionale, interpretare i risultati ottenuti e valutarne la bontà. MODALITA' DIDATTICHE Lezioni in aula di teoria ed esercizi, per la seconda parte sono previste anche lezioni al calcolatore. Finalità delle esercitazioni in laboratorio è l'applicazione delle metodologie statistiche presentate a lezione per costruire modelli interpretativi e previsionali dei fenomeni oggetto di indagine, utilizzando dati reali. Tramite tali esercitazioni lo studente può verificare il suo livello di comprensione della teoria statistica e comprenderne meglio l'uso pratico. PROGRAMMA/CONTENUTO Programma Prima Parte: Richiami di Calcolo delle Probabilità: densità condizionata e valore atteso condizionato, distribuzione normale multivariata. Modelli e statistiche: campione e modello statistico, identificabilità, modelli regolari, il modello di classe esponenziale. Statistiche e distribuzioni campionarie. Statistiche sufficienti, minimali, ancillari e complete. Il lemma di Neyman-Fisher ed il teorema di Basu. Stimatori e loro proprietà: trovare stimatori puntuali: metodo dei momenti, metodo dei minimi quadrati, stima di massima verosimiglianza e sue proprietà. Metodi di valutare stimatori: teoremi di Rao-Blackwell e di Lehmann-Scheffé. Stimatori UMVUE. Informazione attesa di Fisher, disuguaglianza di Cramer-Rao e stimatori efficienti. Verifica statistica di ipotesi. Il teorema di Neyman-Pearson per ipotesi semplici. Il test del rapporto di verosimiglianza. Introduzione alla statistica Bayesiana: leggi di probabilità a priori e a posteriori, coniugate, a priori improprie e piatte, confront con metodi frequentisti. Ogni anno sarà trattato al più uno degli ultimi due argomenti. Programma Seconda Parte: Modelli lineari generali. ANOVA: fattori crossed e nested; dati non bilanciati. Modello sovraparametrizzato: diverse riparametrizzazioni e inversa generalizzata: aspetti teorici e implicazioni pratiche. Modello di regressione lineare multivariata e per misure ripetute. Modelli lineari generalizzati. Modelli esponenziali. Link function. Modelli per dati categorici (binomiale, multinomiale e Poisson). Stime dei coefficienti con metodi iterativi: Newton-Raphson, scoring. Distribuzioni asintotiche per statistiche basate sulla verosimiglianza. Test e indici per la bontà del modello: devianza, chi-quadro. Residui. Test e intervalli di confidenza per i parametri del modello e loro sottoinsiemi. Odd ratio e log-odd ratio. Modelli per dati ordinali e per tabelle di contingenza. Esercitazioni al calcolatore con il software SAS e/o R. TESTI/BIBLIOGRAFIA Prima Parte: Testi consigliati: G. Casella e R.L. Berger, Statistical inference, Wadsworth 62-2002-02/09 D. A. Freedman, Statistical Models, Theory and Practice, Cambridge 62-2009-05 L. Pace e A. Salvan, Teoria della statistica, CEDAM 62-1996-01 M. Gasparini, Modelli probabilistici e statistici, CLUT 60-2006-08 D. Dacunha-Castelle e M. Duflo, Probabilites et Statistiques, Masson 60-1982-18/19/26 e 60-1983-22/23/24 A.C. Davison. Statistical Models, Cambridge University Press, Cambridge, 2003 Letture consigliate: David J. Hand, A very short introduction to Statistics, Oxford 62-2008-05 L. Wasserman. All of Statistics, Springer J. Protter, Probability Essentials, Springer 60-2004-09 S.L. Lauritzen, Graphical models, Oxford University press 62-1996-14 D. Williams, Probability with Martingales, Cambridge Mathematical Textbooks, 1991 Appunti distribuiti a lezione Seconda Parte: Dobson A. J. (2001). An Introduction to Generalized Linear Models 2nd Edition. Chapman and Hall. Rogantin M.P. (2010). Modelli lineari generali e generalizzati. In rete. DOCENTI E COMMISSIONI EVA RICCOMAGNO Ricevimento: Su appuntamento richiesto per email all’indirizzo riccomagno@dima.unige.it MARIA PIERA ROGANTIN Commissione d'esame EVA RICCOMAGNO (Presidente) MARIA PIERA ROGANTIN (Presidente) EMANUELA SASSO LEZIONI INIZIO LEZIONI In accordo con il calendario accademico approvato dal Consiglio di Corsi di Studi. Orari delle lezioni STATISTICA MATEMATICA (S) ESAMI MODALITA' D'ESAME L'esame è unico per le due parti. Consiste in una prova scritta e una prova orale. Sul testo d'esame sono indicati il punteggio e il tempo di svolgimento (normalmente 3 ore). MODALITA' DI ACCERTAMENTO La prova scritta è articolata in vari esercizi di tipo calcolativo ed intepretativo. È anche richiesto il commento di parti di output SAS o R. Sulle pagine web dei docenti e nelle dispense del corso si trovano varie prove scritte passate, alcune con soluzione. La prova orale consiste di domande sulle due parti del corso. Può anche essere richiesta la discussione delle esercitazioni della seconda parte del corso svolte in laboratorio (è opportuno avere quindi gli output delle esercitazioni in SAS o R). Calendario appelli Data appello Orario Luogo Tipologia Note 18/01/2018 09:00 GENOVA Scritto 18/01/2018 09:00 GENOVA Scritto + Orale 19/01/2018 09:00 GENOVA Orale 16/02/2018 09:00 GENOVA Scritto 16/02/2018 09:00 GENOVA Scritto + Orale 04/06/2018 09:00 GENOVA Scritto 04/06/2018 09:00 GENOVA Scritto + Orale 02/07/2018 09:00 GENOVA Scritto 02/07/2018 09:00 GENOVA Scritto + Orale 10/09/2018 09:00 GENOVA Scritto 10/09/2018 09:00 GENOVA Scritto + Orale ALTRE INFORMAZIONI Pagina web dell'insegnamento: Prima parte: http://www.dima.unige.it/~riccomag/Teaching/StatisticaMatematica.html Seconda parte: http://www.dima.unige.it/~rogantin/ModStat/ Prerequisiti Prima Parte: Analisi Matematica I e 2. Calcolo delle Probabilità . Prerequisiti Seconda Parte: Argomenti di Statistica inferenziale e della prima parte di Statistica Matematica (quest'ultima svolta in parallelo) con corrispondenti prerequisiti.