CODICE 52503 ANNO ACCADEMICO 2018/2019 CFU 7 cfu anno 1 MATEMATICA 9011 (LM-40) - GENOVA 7 cfu anno 2 MATEMATICA 9011 (LM-40) - GENOVA 11 cfu anno 3 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (L-35) - GENOVA SETTORE SCIENTIFICO DISCIPLINARE MAT/06 LINGUA Italiano (Inglese a richiesta) SEDE GENOVA PERIODO 1° Semestre PROPEDEUTICITA Propedeuticità in ingresso Per sostenere l'esame di questo insegnamento è necessario aver sostenuto i seguenti esami: STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (coorte 2018/2019) PROBABILITA' 87081 2018 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (coorte 2016/2017) PROBABILITA' 87081 2016 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (coorte 2017/2018) PROBABILITA' 87081 2017 MATERIALE DIDATTICO AULAWEB PRESENTAZIONE L'insegnamento introduce le definizioni ed i concetti principali della statistica matematica classica, dalle nozioni di modello statistico e stimatore puntuale a vari metodi di stima (dei momenti, in verosimiglianza, principio di invarianza) e di valutazione di bontà di uno stimatore. Tutto ciò è applicato nella seconda parte ad una classe di modelli molto fontamentale per le applicazioni, alcune delle quali sono illustrate con lezioni in laboratorio e l'utilizzo del software SAS. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI Inquadrare i problemi di stima parametrica e non parametrica e di verifica delle ipotesi in un contesto rigoroso dal punto di vista matematico. Approfondire lo studio dell’ampia classe dei modelli lineari usando i metodi della statistica matematica. OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO Alla fine del corso lo studente saprà riconoscere i problemi di stima parametri e non parametrica in contesti applicativi formularli rigorosamente da un punto di vista matematico individuare se un modello di regressione è adatto per l'analisi del dato, svolgere l'analisi con software opportuno, sintetizzare i risultati in un report semi-professionale, interpretare i risultati ottenuti e valutarne la bontà. PREREQUISITI Elementi di statistica inferenziale: stimatori puntuali, stimatori intervallari, testi statistici di ipotesi, introduzione al modello di regressione lineare MODALITA' DIDATTICHE Lezioni in aula di teoria ed esercizi, per la seconda parte sono previste anche lezioni al calcolatore. Finalità delle esercitazioni in laboratorio è l'applicazione delle metodologie statistiche presentate a lezione per costruire modelli interpretativi e previsionali dei fenomeni oggetto di indagine, utilizzando dati reali. Tramite tali esercitazioni lo studente può verificare il suo livello di comprensione della teoria statistica e comprenderne meglio l'uso pratico. PROGRAMMA/CONTENUTO Programma Prima Parte: Richiami di Calcolo delle Probabilità: densità condizionata e valore atteso condizionato, distribuzione normale multivariata. Modelli e statistiche: campione e modello statistico, identificabilità, modelli regolari, il modello di classe esponenziale. Statistiche e distribuzioni campionarie. Statistiche sufficienti, minimali, ancillari e complete. Il lemma di Neyman-Fisher ed il teorema di Basu. Stimatori e loro proprietà: trovare stimatori puntuali: metodo dei momenti, metodo dei minimi quadrati, stima di massima verosimiglianza e sue proprietà. Metodi di valutare stimatori: teoremi di Rao-Blackwell e di Lehmann-Scheffé. Stimatori UMVUE. Informazione attesa di Fisher, disuguaglianza di Cramer-Rao e stimatori efficienti. Verifica statistica di ipotesi. Il teorema di Neyman-Pearson per ipotesi semplici. Il test del rapporto di verosimiglianza. Introduzione alla statistica Bayesiana: leggi di probabilità a priori e a posteriori, coniugate, a priori improprie e piatte, confront con metodi frequentisti. Ogni anno sarà trattato al più uno degli ultimi due argomenti. Programma Seconda Parte: Modelli lineari generali. ANOVA: fattori crossed e nested; dati non bilanciati. Modello sovraparametrizzato: diverse riparametrizzazioni e inversa generalizzata: aspetti teorici e implicazioni pratiche. Modello di regressione lineare multivariata e per misure ripetute. Modelli lineari generalizzati. Modelli esponenziali. Link function. Modelli per dati categorici (binomiale, multinomiale e Poisson). Stime dei coefficienti con metodi iterativi: Newton-Raphson, scoring. Distribuzioni asintotiche per statistiche basate sulla verosimiglianza. Test e indici per la bontà del modello: devianza, chi-quadro. Residui. Test e intervalli di confidenza per i parametri del modello e loro sottoinsiemi. Odd ratio e log-odd ratio. Modelli per dati ordinali e per tabelle di contingenza. Esercitazioni al calcolatore con il software SAS e/o R. L'insegnamento da 11 CFU è formato da entrambe le parti. L.insegnamento da 7 CFU è formato dalla prima parte integrata da entrambi gli argomenti Verifica statistica di ipotesi e Introduzione alla statistica Bayesiana oppure integrata da un'attività seminariale. TESTI/BIBLIOGRAFIA Prima Parte: Testi consigliati: G. Casella e R.L. Berger, Statistical inference, Wadsworth 62-2002-02/09 D. A. Freedman, Statistical Models, Theory and Practice, Cambridge 62-2009-05 L. Pace e A. Salvan, Teoria della statistica, CEDAM 62-1996-01 M. Gasparini, Modelli probabilistici e statistici, CLUT 60-2006-08 D. Dacunha-Castelle e M. Duflo, Probabilites et Statistiques, Masson 60-1982-18/19/26 e 60-1983-22/23/24 A.C. Davison. Statistical Models, Cambridge University Press, Cambridge, 2003 Letture consigliate: D.J. Hand, A very short introduction to Statistics, Oxford 62-2008-05 L. Wasserman. All of Statistics, Springer J. Protter, Probability Essentials, Springer 60-2004-09 S.L. Lauritzen, Graphical models, Oxford University press 62-1996-14 D. Williams, Probability with Martingales, Cambridge Mathematical Textbooks, 1991 Appunti dei docenti su aulaweb Seconda Parte: Dobson A. J. (2001). An Introduction to Generalized Linear Models 2nd Edition. Chapman and Hall. Rogantin M.P. (2010). Modelli lineari generali e generalizzati. In rete. DOCENTI E COMMISSIONI EVA RICCOMAGNO Ricevimento: Su appuntamento richiesto per email all’indirizzo riccomagno@dima.unige.it MARIA PIERA ROGANTIN Ricevimento: su appuntamento tramite e-mail Commissione d'esame EVA RICCOMAGNO (Presidente) MARIA PIERA ROGANTIN (Presidente) EMANUELA SASSO LEZIONI INIZIO LEZIONI In accordo con il calendario accademico approvato dal Consiglio di Corsi di Studi. Orari delle lezioni STATISTICA MATEMATICA (S) ESAMI MODALITA' D'ESAME àL'esame è unico per le due parti. Consiste in una prova scritta e una prova orale. Sul testo d'esame sono indicati il punteggio e il tempo di svolgimento (normalmente 3 ore per l'insegnamento da 11 CFU). Gli esercizi per l'insegnamento da 7 CFU sono chiaramente indicati sul testo d'esame. La prova scritta è articolata in vari esercizi di tipo calcolativo ed intepretativo. È anche richiesto il commento di parti di output SAS o R. Sulle pagine web dei docenti e nelle dispense del corso si trovano varie prove scritte passate, alcune con soluzione. La prova orale consiste di domande sulle due parti del corso. Può anche essere richiesta la discussione delle esercitazioni della seconda parte del corso svolte in laboratorio (è opportuno avere quindi gli output delle esercitazioni in SAS o R). MODALITA' DI ACCERTAMENTO Nella prova scritta si valutano la comprensione dei concetti, le capacità di calcolo e di interpretazione sopratutto di output SAS o R. Nella prova orale si valutano le capacità espositive, di comprensione e rielaborazione degli aspetti teorici della materia. Calendario appelli Data appello Orario Luogo Tipologia Note 15/01/2019 09:00 GENOVA Scritto 16/01/2019 09:00 GENOVA Orale 04/02/2019 09:00 GENOVA Scritto 05/02/2019 09:00 GENOVA Orale 06/06/2019 09:00 GENOVA Scritto 12/07/2019 09:00 GENOVA Scritto 09/09/2019 09:00 GENOVA Scritto ALTRE INFORMAZIONI Pagina web dell'insegnamento: Prima parte: http://www.dima.unige.it/~riccomag/Teaching/StatisticaMatematica.html Seconda parte: http://www.dima.unige.it/~rogantin/ModStat/ Prerequisiti Prima Parte: Analisi Matematica I e 2. Calcolo delle Probabilità . Prerequisiti Seconda Parte: Argomenti di Statistica inferenziale e della prima parte di Statistica Matematica (quest'ultima svolta in parallelo) con corrispondenti prerequisiti.