CODICE 41601 ANNO ACCADEMICO 2023/2024 CFU 9 cfu anno 1 ECONOMICS AND DATA SCIENCE 11267 (LM-56) - GENOVA SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01 LINGUA Inglese SEDE GENOVA PERIODO 2° Semestre PROPEDEUTICITA Propedeuticità in ingresso Per sostenere l'esame di questo insegnamento è necessario aver sostenuto i seguenti esami: ECONOMICS AND DATA SCIENCE 11267 (coorte 2023/2024) SOFTWARE R 106839 2023 MATERIALE DIDATTICO AULAWEB PRESENTAZIONE L'insegnamento di Statistical models tratta gli elementi fondamentali dell’inferenza statistica, sia tramite l'approccio classico basato sulla verosimiglianza che tramite simulazione, e gli aspetti sia teorici che applicativi dell’analisi dei modelli di regressione e classificazione con particolare attenzione alle applicazioni in campo economico e sociale. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI L'insegnamento si propone di fornire una precisa panoramica dell'inferenza statistica a un livello intermedio. La prima parte riguarda la statistica matematica classica, basata sulla verosimiglianza, con alcuni cenni alle tecniche basate sulla simulazione. La seconda parte è invece incentrata sulle principali tecniche di regressione e classificazione. I temi trattati e gli esempi presentati permetteranno agli studenti di affrontare in autonomia problemi di analisi dati in contesti differenti e di comprendere i fondamenti dei modelli statistici di uso corrente nelle applicazioni economiche. OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO L’insegnamento è articolato in due parti: Elementi di statistica inferenziale classica: principali classi di distribuzioni univariate e multivariate, verosimiglianza e sue proprietà , simulazione e bootstrap. Modelli di regressione di classificazione: Regressione multipla, teoria dei modelli lineari generalizzati, regressione logistica e per conteggi, tecniche non-parametriche. Tecniche diagnostiche e metodi di selezione del modello. Tutti gli argomenti saranno accompagnati da esercizi pratici in R, in modo che lo studente possa affiancare alla comprensione degli argomenti trattati anche la capacità di applicare corrette analisi statistiche in contesti reali e di comprendere gli output delle procedure statistiche. Conoscenza e comprensione: Gli studenti dovranno conoscere le principali tecniche e i principali strumenti per la statistica inferenziale. Dovranno essere in grado di inquadrare tali strumenti in termini generali (sia teorici che applicati), e di analizzarne gli strumenti matematici e statistici sottostanti. Capacità di applicare conoscenza e comprensione: Gli studenti saranno in grado di individuare, di fronte a problemi applicati in diversi contesti, la corretta tecnica di analisi. Inoltre, saranno in grado di valutare criticamente i risultati ottenuti tramite software statistico. Autonomia di giudizio: Gli studenti dovranno acquisire consapevolezza delle potenzialità e dei limiti delle tecniche statistiche presentate, attraverso l’analisi di esempi e studio di casi. Abilità comunicative: Gli studenti dovranno saper utilizzare il linguaggio tecnico-statistico corretto per la comunicazione dei risultati e per la descrizione delle tecniche utilizzate. Capacità di apprendimento: Gli studenti svilupperanno adeguate capacità di apprendimento che consentano loro di continuare ad approfondire in modo autonomo altri aspetti della materia e diversi campi di applicazione rispetto a quelli illustrati. Inoltre, dovranno poter utilizzare anche autonomamente il software R.. PREREQUISITI Le competenze tipiche fornite dagli insegnamenti introduttivi di Matematica Generale e di Statistica per lauree triennali di ambito economico o azidendale. MODALITA' DIDATTICHE Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio. PROGRAMMA/CONTENUTO 0. Introduzione e richiami su stima e verifica di ipotesi. 1. Le principali famiglie di distribuzioni discrete. 2. Le principali famiglie di distribuzioni continue. 3. Distribuzioni multivariate. 4. Verosimiglianza. Stima per massima verosimiglianza. Informazione. La famiglia esponenziale. 5. Simulazione e bootstrap. 6. Regressione lineare multipla e tecniche k-NN. 7. Teoria dei modelli lineari generalizzati. 8. Regressione logistica 9. Regressione per conteggi. 10. Metodi di selezione del modello e regolarizzazione. TESTI/BIBLIOGRAFIA Evans, Rosenthal, Probability and Statistics. The Science of Uncertainty, Second edition. James G, Witten D, Hastie T and Tibshirani R, An Introduction to Statistical Learning. With Applications in R. Springer (disponibile sulla webpage degli autori). Letture complementari e approfondimenti saranno tratte da: Casella G and Berger RL, Statistical Inference. Duxbury Efron B and Hastie T, Computer Age Statistical Inference. Algorithms, Evidence, and Data Science. Stanford University (disponibile sulla webpage degli autori). Materiali aggiuntivi saranno resi disponibili su Aulaweb a cura del docente. DOCENTI E COMMISSIONI FABIO RAPALLO Ricevimento: Su appuntamento richiesto per email all’indirizzo fabio.rapallo@unige.it Commissione d'esame FABIO RAPALLO (Presidente) CORRADO LAGAZIO MARTA NAI RUSCONE LEZIONI INIZIO LEZIONI L'insegnamento inizia nella prima settimana di lezioni del calendario di Dipartimento per il secondo semestre. Orari delle lezioni L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy ESAMI MODALITA' D'ESAME L’esame consiste in una prova scritta che si compone di tre parti: 1) una domanda di carattere generale a risposta aperta 2) una o più domande specifiche a risposta aperta 3) un output da commentare Il regolamento completo d’esame sarà pubblicato sulla pagina dell’insegnamento su Aulaweb. Per gli studenti frequentanti, saranno svolte prove intermedie sostitutive dell'esame che prevederanno anche l'utlizzo del software R. MODALITA' DI ACCERTAMENTO Le domande dell’esame scritto sono scelte in modo da coprire, per quanto possibile, tutti gli argomenti del programma d'esame. La domanda generale ha lo scopo di valutare il grado di conoscenza della materia e l’acquisizione del linguaggio tecnico corretto, le domande specifiche sono tese a valutare la capacità critica dello studente, mentre il commento all’output serve a valutarne le capacità di applicazione. Calendario appelli Data appello Orario Luogo Tipologia Note 16/01/2024 09:30 GENOVA Scritto 30/01/2024 09:30 GENOVA Scritto 21/05/2024 09:30 GENOVA Scritto 11/06/2024 09:30 GENOVA Scritto 09/07/2024 09:30 GENOVA Scritto 09/09/2024 09:30 GENOVA Scritto ALTRE INFORMAZIONI Si consigliano gli studenti con certificazione di DSA, di disabilità o di altri bisogni educativi speciali di contattare il/la docente all’inizio del corso per concordare modalità didattiche e d’esame che, nel rispetto degli obiettivi dell’insegnamento, tengano conto delle modalità di apprendimento individuali e forniscano idonei strumenti compensativi. Agenda 2030 Istruzione di qualità Partnership per gli obiettivi