Salta al contenuto principale della pagina

STATISTICAL MODELS

CODICE 41601
ANNO ACCADEMICO 2021/2022
CFU
  • 9 cfu al 1° anno di 11267 ECONOMICS AND DATA SCIENCE (LM-56) - GENOVA
  • SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01
    LINGUA Inglese
    SEDE
  • GENOVA
  • PERIODO 2° Semestre
    PROPEDEUTICITA
    Propedeuticità in ingresso
    Per sostenere l’esame di questo insegnamento è necessario aver sostenuto i seguenti esami:
    • ECONOMICS AND DATA SCIENCE 11267 (coorte 2021/2022)
    • SOFTWARE R 106839
    Propedeuticità in uscita
    Questo insegnamento è propedeutico per gli insegnamenti:
    • ECONOMIA E ISTITUZIONI FINANZIARIE 8700 (coorte 2021/2022)
    • FINANCIAL ECONOMETRICS 85554
    MATERIALE DIDATTICO AULAWEB

    PRESENTAZIONE

    L'insegnamento di Statistical models intende fornire gli elementi fondamentali dell’inferenza classica tramite verosimiglianza, dell’analisi dei modelli di regressione e classificazione per le applicazioni in campo economico e sociale, e una introduzione alle tecniche di simulazione in ambito statistico.

    OBIETTIVI E CONTENUTI

    OBIETTIVI FORMATIVI

    Il corso si propone di fornire una precisa panoramica dell'inferenza statistica a un livello intermedio. La prima parte riguarda la statistica matematica classica, basata sulla verosimiglianza, con alcuni cenni alle tecniche basate sulla simulazione. La seconda parte del corso e' invece incentrata sulle principali tecniche di regressione e classificazione. Verranno in particolare trattati i modelli lineari generalizzati sia per riposte discrete che per risposte continue. Saranno poi illustrati alcuni metodi di regressione e classificazione non parametrici, e verranno infine affrontati metodi classici di validazione, selezione del modello e riduzione della dimensionalità.

    OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

    L’insegnamento è articolato in due parti:

    1. Elementi di statistica inferenziale classica: principali classi di distribuzioni univariate e multivariate, simulazione, modelli statistici, verosimiglianza e sue proprietà.
    2. Modelli di regressione di classificazione: Regressione multipla, teoria dei modelli lineari generalizzati, regressione logistica e per conteggi, tecniche nonparametriche. Tecniche diagnostiche e metodi di selezione del modello.

    Tutti gli argomenti saranno accompagnati da esercizi pratici in R, in modo che lo studente possa affiancare alla comprensione degli argomenti trattati anche la capacita' di applicare corrette analisi statistiche in contesti reali e di comprendere gli output delle procedure statistiche.

    Conoscenza e comprensione: Gli studenti dovranno conoscere le principali tecniche e i principali strumenti per la statistica inferenziale. Dovranno essere in grado di inquadrare tali strumenti in termini generali (sia teorici che applicati), e di analizzarne gli strumenti matematici e statistici sottostanti.

    Capacità di applicare conoscenza e comprensione: Gli studenti saranno in grado di individuare, di fronte a problemi applicati in diversi contesti, la corretta tecnica di analisi. Inoltre, saranno in grado di valutare criticamente i risultati ottenuti tramite software statistico.

    Autonomia di giudizio: Gli studenti dovranno acquisire consapevolezza delle potenzialità e dei limiti delle tecniche statistiche presentate, attraverso l’analisi di esempi e studio di casi.

    Abilità comunicative: Gli studenti dovranno saper utilizzare il linguaggio tecnico-statistico corretto per la comunicazione dei risultati e per la descrizione delle tecniche utilizzate.

    Capacità di apprendimento: Gli studenti svilupperanno adeguate capacità di apprendimento che consentano loro di continuare ad approfondire in modo autonomo altri aspetti della materia e diversi campi di applicazione rispetto a quelli illustrati. Inoltre, dovranno poter utilizzare anche autonomamente il software R.

     

    PREREQUISITI

    I contenuti tipici dei corsi introduttivi di Matematica Generale e di Statistica per lauree triennali.

     

    MODALITA' DIDATTICHE

    Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio.

    PROGRAMMA/CONTENUTO

    0. Introduzione e richiami su stima e verifica di ipotesi.

    1. Le principali famiglie di distribuzioni discrete e continue.

    2. Distribuzioni multivariate.

    3. Simulazione. Simulazione distribution-based e agent-based.

    4. Verosimiglianza e sufficienza. Stima per massima verosimiglianza. Informazione. La famiglia esponenziale.

    5. Regressione lineare multipla e tecniche k-NN.

    6. Teoria dei modelli lineari generalizzati.

    7. Regressione logistica e per conteggi.

    8. Metodi di selezione del modello e regolarizzazione.

    TESTI/BIBLIOGRAFIA

    Evans, Rosenthal, Probability and Statistics. The Science of Uncertainty, Second edition.

    James G, Witten D, Hastie T and Tibshirani R, An Introduction to Statistical Learning. With Applications in R. Springer (disponibile sulla webpage degli autori).

    Letture complementari e approfondimenti saranno tratte da:

    Casella G and Berger RL, Statistical Inference. Duxbury

    Efron B and Hastie T, Computer Age Statistical Inference. Algorithms, Evidence, and Data Science. Stanford University (disponibile sulla webpage degli autori).

    Materiali aggiuntivi (sia in Italiano che in Inglese) saranno resi disponibili su Aulaweb a cura del docente.

    DOCENTI E COMMISSIONI

    Commissione d'esame

    FABIO RAPALLO (Presidente)

    CORRADO LAGAZIO

    MARTA NAI RUSCONE

    LEZIONI

    INIZIO LEZIONI

    Il corso segue il calendario di Dipartimento per il secondo semestre.

    Orari delle lezioni

    L'orario di tutti gli insegnamenti è consultabile su EasyAcademy.

    ESAMI

    MODALITA' D'ESAME

    Qualora l'andamento dell'epidemia COVID consenta gli esami in presenza, l’esame consisterà in una prova scritta, che potrà essere sostituita – per i frequentanti – da due prove intermedie da svolgersi durante il corso.

    In caso sia necessario svolgere esami in remoto, gli studenti saranno avvertiti appena possibile della variazione delle modalità d'esame. L'esame in remoto sarà strutturato per quanto possibile come l'esame in presenza.

    Il regolamento completo d’esame sarà pubblicato sulla pagina del corso su Aulaweb e tenuto aggiornato in base alle disposizioni normative e regolamentari che via via dovranno esser rispettate.

    MODALITA' DI ACCERTAMENTO

    L'esame scritto si compone di tre parti:

    1) una domanda di carattere generale a risposta aperta

    2) una o più domande specifiche a risposta aperta

    3) un output da commentare

    Le domande sono scelte in modo da coprire, per quanto possibile, tutti gli argomenti del programma d'esame. La domanda generale ha lo scopo di valutare il grado di conoscenza della materia e l’acquisizione del linguaggio tecnico corretto, le domande specifiche sono tese a valutare la capacità critica dello studente, mentre il commento all’output serve a valutarne le capacità di applicazione.

     

     

    Calendario appelli

    Data Ora Luogo Tipologia Note
    20/12/2021 09:30 GENOVA Scritto
    17/01/2022 09:30 GENOVA Scritto
    07/02/2022 09:30 GENOVA Scritto
    04/05/2022 14:00 GENOVA Scritto appello straordinario riservato esclusivamente ai laureandi a.a. 2020/21
    06/06/2022 15:00 GENOVA Scritto
    20/06/2022 15:00 GENOVA Scritto
    12/07/2022 15:00 GENOVA Scritto
    06/09/2022 15:00 GENOVA Scritto