CODICE 41601 ANNO ACCADEMICO 2021/2022 CFU 9 cfu anno 1 ECONOMICS AND DATA SCIENCE 11267 (LM-56) - GENOVA SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01 LINGUA Inglese SEDE GENOVA PERIODO 2° Semestre PROPEDEUTICITA Propedeuticità in ingresso Per sostenere l'esame di questo insegnamento è necessario aver sostenuto i seguenti esami: ECONOMICS AND DATA SCIENCE 11267 (coorte 2021/2022) SOFTWARE R 106839 2021 Propedeuticità in uscita Questo insegnamento è propedeutico per gli insegnamenti: ECONOMIA E ISTITUZIONI FINANZIARIE 8700 (coorte 2021/2022) FINANCIAL ECONOMETRICS 85554 MATERIALE DIDATTICO AULAWEB PRESENTAZIONE L'insegnamento di Statistical models intende fornire gli elementi fondamentali dell’inferenza classica tramite verosimiglianza, dell’analisi dei modelli di regressione e classificazione per le applicazioni in campo economico e sociale, e una introduzione alle tecniche di simulazione in ambito statistico. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI Il corso si propone di fornire una precisa panoramica dell'inferenza statistica a un livello intermedio. La prima parte riguarda la statistica matematica classica, basata sulla verosimiglianza, con alcuni cenni alle tecniche basate sulla simulazione. La seconda parte del corso e' invece incentrata sulle principali tecniche di regressione e classificazione. Verranno in particolare trattati i modelli lineari generalizzati sia per riposte discrete che per risposte continue. Saranno poi illustrati alcuni metodi di regressione e classificazione non parametrici, e verranno infine affrontati metodi classici di validazione, selezione del modello e riduzione della dimensionalità. OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO L’insegnamento è articolato in due parti: Elementi di statistica inferenziale classica: principali classi di distribuzioni univariate e multivariate, simulazione, modelli statistici, verosimiglianza e sue proprietà. Modelli di regressione di classificazione: Regressione multipla, teoria dei modelli lineari generalizzati, regressione logistica e per conteggi, tecniche nonparametriche. Tecniche diagnostiche e metodi di selezione del modello. Tutti gli argomenti saranno accompagnati da esercizi pratici in R, in modo che lo studente possa affiancare alla comprensione degli argomenti trattati anche la capacita' di applicare corrette analisi statistiche in contesti reali e di comprendere gli output delle procedure statistiche. Conoscenza e comprensione: Gli studenti dovranno conoscere le principali tecniche e i principali strumenti per la statistica inferenziale. Dovranno essere in grado di inquadrare tali strumenti in termini generali (sia teorici che applicati), e di analizzarne gli strumenti matematici e statistici sottostanti. Capacità di applicare conoscenza e comprensione: Gli studenti saranno in grado di individuare, di fronte a problemi applicati in diversi contesti, la corretta tecnica di analisi. Inoltre, saranno in grado di valutare criticamente i risultati ottenuti tramite software statistico. Autonomia di giudizio: Gli studenti dovranno acquisire consapevolezza delle potenzialità e dei limiti delle tecniche statistiche presentate, attraverso l’analisi di esempi e studio di casi. Abilità comunicative: Gli studenti dovranno saper utilizzare il linguaggio tecnico-statistico corretto per la comunicazione dei risultati e per la descrizione delle tecniche utilizzate. Capacità di apprendimento: Gli studenti svilupperanno adeguate capacità di apprendimento che consentano loro di continuare ad approfondire in modo autonomo altri aspetti della materia e diversi campi di applicazione rispetto a quelli illustrati. Inoltre, dovranno poter utilizzare anche autonomamente il software R. PREREQUISITI I contenuti tipici dei corsi introduttivi di Matematica Generale e di Statistica per lauree triennali. MODALITA' DIDATTICHE Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio. PROGRAMMA/CONTENUTO 0. Introduzione e richiami su stima e verifica di ipotesi. 1. Le principali famiglie di distribuzioni discrete e continue. 2. Distribuzioni multivariate. 3. Simulazione. Simulazione distribution-based e agent-based. 4. Verosimiglianza e sufficienza. Stima per massima verosimiglianza. Informazione. La famiglia esponenziale. 5. Regressione lineare multipla e tecniche k-NN. 6. Teoria dei modelli lineari generalizzati. 7. Regressione logistica e per conteggi. 8. Metodi di selezione del modello e regolarizzazione. TESTI/BIBLIOGRAFIA Evans, Rosenthal, Probability and Statistics. The Science of Uncertainty, Second edition. James G, Witten D, Hastie T and Tibshirani R, An Introduction to Statistical Learning. With Applications in R. Springer (disponibile sulla webpage degli autori). Letture complementari e approfondimenti saranno tratte da: Casella G and Berger RL, Statistical Inference. Duxbury Efron B and Hastie T, Computer Age Statistical Inference. Algorithms, Evidence, and Data Science. Stanford University (disponibile sulla webpage degli autori). Materiali aggiuntivi (sia in Italiano che in Inglese) saranno resi disponibili su Aulaweb a cura del docente. DOCENTI E COMMISSIONI FABIO RAPALLO Ricevimento: Ricevimento studenti secondo semestre 2021-2022: Martedi ore 9:30-11:30 su prenotazione tramite email. Il ricevimento è in presenza ma è possibile concordare nello stesso orario anche un ricevimento su Teams. Office hours second semester 2021-2022: Tuesday 9:30am-11:30am upon reservation via email. The office hours are in-person, but it is possible to arrange a Teams call in the same hours. Commissione d'esame FABIO RAPALLO (Presidente) CORRADO LAGAZIO MARTA NAI RUSCONE LEZIONI INIZIO LEZIONI Il corso segue il calendario di Dipartimento per il secondo semestre. Orari delle lezioni L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy ESAMI MODALITA' D'ESAME Qualora l'andamento dell'epidemia COVID consenta gli esami in presenza, l’esame consisterà in una prova scritta, che potrà essere sostituita – per i frequentanti – da due prove intermedie da svolgersi durante il corso. In caso sia necessario svolgere esami in remoto, gli studenti saranno avvertiti appena possibile della variazione delle modalità d'esame. L'esame in remoto sarà strutturato per quanto possibile come l'esame in presenza. Il regolamento completo d’esame sarà pubblicato sulla pagina del corso su Aulaweb e tenuto aggiornato in base alle disposizioni normative e regolamentari che via via dovranno esser rispettate. MODALITA' DI ACCERTAMENTO L'esame scritto si compone di tre parti: 1) una domanda di carattere generale a risposta aperta 2) una o più domande specifiche a risposta aperta 3) un output da commentare Le domande sono scelte in modo da coprire, per quanto possibile, tutti gli argomenti del programma d'esame. La domanda generale ha lo scopo di valutare il grado di conoscenza della materia e l’acquisizione del linguaggio tecnico corretto, le domande specifiche sono tese a valutare la capacità critica dello studente, mentre il commento all’output serve a valutarne le capacità di applicazione. Calendario appelli Data appello Orario Luogo Tipologia Note 17/01/2022 09:30 GENOVA Scritto 07/02/2022 09:30 GENOVA Scritto 04/05/2022 14:00 GENOVA Scritto 06/06/2022 15:00 GENOVA Scritto 20/06/2022 15:00 GENOVA Scritto 12/07/2022 15:00 GENOVA Scritto 06/09/2022 15:00 GENOVA Scritto