CODICE 102300 ANNO ACCADEMICO 2020/2021 CFU 6 cfu anno 3 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI 8766 (L-35) - GENOVA SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01 SEDE GENOVA PERIODO 2° Semestre MATERIALE DIDATTICO AULAWEB PRESENTAZIONE Esperti introducono o approfondiscono tecniche statistiche che utilizzano nel loro lavoro illustrandone la applicazione tramite esempi concreti. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI Fornire alcuni strumenti statistici legati a specifiche applicazioni tramite interventi di esperti OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO Alla fine del corso lo studente saprà riconoscere il grado di applicablità delle tecniche di analisi imparate riconoscere i principali problemi di analisi dati nei contesti applicativi sotto elencati individuare i metodi di analisi più adatti svolgere le analisi con gli opportuni supporti informatici interpretare i risultati delle analisi e valutarne la validità sintetizzare i risultati in un report semi-professionale, interpretare i risultati ottenuti Modelli di misurazione in psicometria (16 ore di lezioni frontali) Fornire un'Introduzione alla teoria della psicometria per statistici e fornisce gli strumenti anche informatici (software R) per eseguire semplici le analisi psicometriche di base. Demografia dell'Italia e del mondo: temi, dati e e misure (8 ore di lezioni frontali) Fornire un'introduzione alla demografia per saper comunicare dati demografici al cittadino medio. Introduzione alla statistica Bayesiana (8 ore di lezioni frontali) Acquisire le principali nozioni relative alla modellazione Bayesiana. Statistica Ufficiale (8 ore di lezioni frontali. In alternativa potrebbe essere offerto un modulo di Applicazioni in industria) Il sistema della statistica pubblica. Il problema della molteplicità dei test statistici in ricerca biomedicina (8 ore di lezioni frontali) Acquisire coscienza del problema e saperlo affrontare con atteggiamento critico. A questi moduli si affiancheranno attività seminariali su altri aspetti applicati della statistica matematica, usualmente presentate da data scientists operanti in aziende, società di consumo, enti pubblici. PREREQUISITI Fondamenti di statistica inferenziale. Nozioni di Statistica matematica. MODALITA' DIDATTICHE Lezioni in aula e laboratorio PROGRAMMA/CONTENUTO Psicometria La teoria classica dei test Le variabili psicologiche o costrutti Definizione del dominio di contenuto del costrutto e delle sue operazionalizzazioni Modelli di misurazione in psicologia ad indicatori riflessivi e formativi Analisi degli item e attendibilità Analisi fattoriale esplorativa Analisi fattoriale confermativa Modelli di equazioni strutturali Verranno mostrati esempi di analisi con R (packages 'psych', 'lavaan' e 'semPlot') Demografia Il corso si basa sull'attenta lettura ed analisi di un volume divulgativo fortemente basato sui dati. Raccolta, analisi e presentazione dei dati per aiutare la società a organizzarsi in modo da trasformare le opportunità in nuove realtà. Il testo di riferimento da analizzare è cambiato negli anni. Introduzione alla statistica Bayesiana Leggi di probabilità a priori e a posteriori, coniugate, a priori improprie e piatte, confront con metodi frequentisti. Statistica Ufficiale Statistica pubblica, fonti statistiche, dato ufficiale, SISTAN, normativa sulla statistica, codici della statistica. Il problema della molteplicità dei test statistici in ricerca biomedicina I test statistici d'ipotesi sono caratterizzati da una probabilità di falso positivo (livello di significatività) e da una probabilità di falso negativo (1-potenza del test). Quando più test sono effettuati, la probabilità che almeno una vera ipotesi sia rigettata aumenta rapidamente. In ricerca sperimentale, ciò accade per esempio quando più marcatori vengono testati, un test diagnostico è ripetuto più volte, più farmaci vengono comparati a uno standard, più criteri di valutazione vengono usati per valutare l'efficacia di un trattamento, ecc. La significatività dei risultati osservati viene largamente sopravvalutata qualora i risultati dei test più significativi sono interpretati senza tenere conto della molteplicità dei test effettuati. Questo problema è ancor più cruciale nel caso in cui solo i risultati più significativi vengono riportati e divulgati. Nel caso di test molteplici, diverse misure di errore sono disponibili, in particolare la probabilità di incorrere in almeno un falso positivo (FWER, familywise error rate) e il tasso di false scoperte (FDR, false discovery rate). Ciascuna di esse ha un significato diverso ed è più o meno appropriata a seconda che il fine della ricerca sia più esplorativo o confermativo. Diversi metodi di correzione per test multipli sono disponibili nella letteratura statistica. Ciascun metodo di correzione ha come obiettivo il controllo del FWER o del FDR e ciascuno ha proprietà diverse. Nel contesto della valutazione di diversi criteri di efficacia nei trial clinici, l'FDA (US Food and Drug Administration) ha messo a disposizione delle linee guida preliminari. Esempi pratici con software R: inflazione del livello di più test combinati, correzione del livello di test multipli. TESTI/BIBLIOGRAFIA Psicometria Chiorri, C. (2011). Teoria e tecnica psicometrica. Milano: McGraw-Hill (capitoli 1, 2, 4 e 5). Ulteriore materiale (slides, codici di R) verrà condiviso online dal docente. Demografia (il testo sarà precisato in seguito) Gianpiero Dalla Zuanna e Guglielmo Weber (2012). Cose da non credere. Il senso comune alla prova dei numeri. Laterza. Gianpiero Dalla Zuanna e Stefano Allievi (2015). Tutto quello che non vi hanno mai detto sull'immigrazione, Laterza. Maria Castiglioni e Gianpiero Dalla Zuanna (2018). La famiglia è in crisi. Falso! Laterza. Statistica Ufficiale Slide fornite dal docente e siti web degli istituti statistici pubblici. Introduzione alla statistica Bayesiana M. Gasparini, Modelli probabilistici e statistici, CLUT 60-2006-08 Il problema della molteplicità dei test statistici in ricerca biomedicina Dmitrienko, D’Agostino, 2013, Traditional multiplicity adjustment methods in clinical trials. Stat Med 32 Goeman J, Solari A, 2014, Multiple Hypothesis Testing in Genomics. Stat Med 33 FDA, 2017, Multiple Endpoints in Clinical Trials. Draft Guidance for Industry. UCM536750 DOCENTI E COMMISSIONI EVA RICCOMAGNO Ricevimento: Su appuntamento richiesto per email all’indirizzo riccomagno@dima.unige.it CARLO CHIORRI Ricevimento: Orari e luogo di ricevimento Di persona: martedì, ore 12-13, Dipartimento di Scienze della Formazione, piano IV, stanza 4A3, Corso Podestà, 2, 16128 Genova. Si segnala che durante l'autunno/inverno 2020/2021, in base alle indicazioni dell'Ateneo per il contenimento dell'epidemia di Covid-19, non sarà svolto ricevimento di persona. Gli studenti che hanno necessità di un colloquio possono richiederlo via e-mail al docente, in modo da concordare giorno, orario e piattaforma (possibili Microsoft Teams, Google Meet, Skype, Zoom, e altre) Contatti del docente Telefono 010 209 53709 (non attivo durante l'autunno/inverno 2020) E-mail: email unige oppure emal gmail Commissione d'esame EVA RICCOMAGNO (Presidente) MARTA NAI RUSCONE CARLO CHIORRI (Presidente Supplente) MARIA PIERA ROGANTIN (Supplente) LEZIONI INIZIO LEZIONI In accordo con il calendario accademico approvato dal Consiglio di Corsi di Studi. Orari delle lezioni L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy ESAMI MODALITA' D'ESAME Psicometria Scritto e discussione orale Demografia Questionario con risposta a crocette Statistica Ufficiale Questionario con risposta a crocette e discussione orale Introduzione alla statistica Bayesiana Un esercizio scritto da svolgersi in 30 minuti e discussione orale In voto finale è la media pesata dei voti delle varie parti. I pesi sono le ore di docenza frontale. MODALITA' DI ACCERTAMENTO Psicometria: Allo studente verrà presentato l'output di R di alcune analisi statistiche realizzate su dati reali. Sulla base di quanto appreso durante il corso e dal materiale di studio, nella prova scritta viene chiesto di interpretare e commentare i risultati ed evidenziare eventuali criticità. Nella discussione orale verranno commentati gli eventuali errori della prova scritta e indagata la preparazione dello studente sulla teoria psicometrica. Demografia: la capacità dello studente di ritrovare in un complesso testo divulgativo precise informazioni e dati, oltre all’individuazione della metodologia statistica utilizzata per le analisi riportate nel testo. Statistica Ufficiale: la capacità dello studente di riconoscere il dato ufficiale e i suoi usi. Introduzione alla statistica Bayesiana: l'abilità di applicare in un contesto teorico le tecniche matematico/statistiche apprese e riconoscere l'utilizzabilità per la modellazione di fenomeni basata su osservazioni empiriche. Calendario appelli Data appello Orario Luogo Tipologia Note 10/05/2021 09:00 GENOVA Scritto + Orale 14/06/2021 09:00 GENOVA Scritto + Orale 16/07/2021 09:00 GENOVA Scritto + Orale ALTRE INFORMAZIONI Pagine web dell'insegnamento: gli esperti aziendali potranno fornire materiale didattico ulteriore. L’attività formativa, avendo un carattere prevalentemente seminariale e prevedendo anche docenti esterni, è rivolta a quegli studenti che possono frequentare regolarmente le lezioni.