Salta al contenuto principale
CODICE 41601
ANNO ACCADEMICO 2021/2022
CFU
SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01
LINGUA Inglese
SEDE
  • GENOVA
PERIODO 2° Semestre
PROPEDEUTICITA
Propedeuticità in ingresso
Per sostenere l'esame di questo insegnamento è necessario aver sostenuto i seguenti esami:
  • ECONOMICS AND DATA SCIENCE 11267 (coorte 2021/2022)
  • SOFTWARE R 106839 2021
Propedeuticità in uscita
Questo insegnamento è propedeutico per gli insegnamenti:
  • ECONOMIA E ISTITUZIONI FINANZIARIE 8700 (coorte 2021/2022)
  • FINANCIAL ECONOMETRICS 85554
MATERIALE DIDATTICO AULAWEB

PRESENTAZIONE

L'insegnamento di Statistical models intende fornire gli elementi fondamentali dell’inferenza classica tramite verosimiglianza, dell’analisi dei modelli di regressione e classificazione per le applicazioni in campo economico e sociale, e una introduzione alle tecniche di simulazione in ambito statistico.

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

Il corso si propone di fornire una precisa panoramica dell'inferenza statistica a un livello intermedio. La prima parte riguarda la statistica matematica classica, basata sulla verosimiglianza, con alcuni cenni alle tecniche basate sulla simulazione. La seconda parte del corso e' invece incentrata sulle principali tecniche di regressione e classificazione. Verranno in particolare trattati i modelli lineari generalizzati sia per riposte discrete che per risposte continue. Saranno poi illustrati alcuni metodi di regressione e classificazione non parametrici, e verranno infine affrontati metodi classici di validazione, selezione del modello e riduzione della dimensionalità.

OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

L’insegnamento è articolato in due parti:

  1. Elementi di statistica inferenziale classica: principali classi di distribuzioni univariate e multivariate, simulazione, modelli statistici, verosimiglianza e sue proprietà.
  2. Modelli di regressione di classificazione: Regressione multipla, teoria dei modelli lineari generalizzati, regressione logistica e per conteggi, tecniche nonparametriche. Tecniche diagnostiche e metodi di selezione del modello.

Tutti gli argomenti saranno accompagnati da esercizi pratici in R, in modo che lo studente possa affiancare alla comprensione degli argomenti trattati anche la capacita' di applicare corrette analisi statistiche in contesti reali e di comprendere gli output delle procedure statistiche.

Conoscenza e comprensione: Gli studenti dovranno conoscere le principali tecniche e i principali strumenti per la statistica inferenziale. Dovranno essere in grado di inquadrare tali strumenti in termini generali (sia teorici che applicati), e di analizzarne gli strumenti matematici e statistici sottostanti.

Capacità di applicare conoscenza e comprensione: Gli studenti saranno in grado di individuare, di fronte a problemi applicati in diversi contesti, la corretta tecnica di analisi. Inoltre, saranno in grado di valutare criticamente i risultati ottenuti tramite software statistico.

Autonomia di giudizio: Gli studenti dovranno acquisire consapevolezza delle potenzialità e dei limiti delle tecniche statistiche presentate, attraverso l’analisi di esempi e studio di casi.

Abilità comunicative: Gli studenti dovranno saper utilizzare il linguaggio tecnico-statistico corretto per la comunicazione dei risultati e per la descrizione delle tecniche utilizzate.

Capacità di apprendimento: Gli studenti svilupperanno adeguate capacità di apprendimento che consentano loro di continuare ad approfondire in modo autonomo altri aspetti della materia e diversi campi di applicazione rispetto a quelli illustrati. Inoltre, dovranno poter utilizzare anche autonomamente il software R.

 

PREREQUISITI

I contenuti tipici dei corsi introduttivi di Matematica Generale e di Statistica per lauree triennali.

 

MODALITA' DIDATTICHE

Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio.

PROGRAMMA/CONTENUTO

0. Introduzione e richiami su stima e verifica di ipotesi.

1. Le principali famiglie di distribuzioni discrete e continue.

2. Distribuzioni multivariate.

3. Simulazione. Simulazione distribution-based e agent-based.

4. Verosimiglianza e sufficienza. Stima per massima verosimiglianza. Informazione. La famiglia esponenziale.

5. Regressione lineare multipla e tecniche k-NN.

6. Teoria dei modelli lineari generalizzati.

7. Regressione logistica e per conteggi.

8. Metodi di selezione del modello e regolarizzazione.

TESTI/BIBLIOGRAFIA

Evans, Rosenthal, Probability and Statistics. The Science of Uncertainty, Second edition.

James G, Witten D, Hastie T and Tibshirani R, An Introduction to Statistical Learning. With Applications in R. Springer (disponibile sulla webpage degli autori).

Letture complementari e approfondimenti saranno tratte da:

Casella G and Berger RL, Statistical Inference. Duxbury

Efron B and Hastie T, Computer Age Statistical Inference. Algorithms, Evidence, and Data Science. Stanford University (disponibile sulla webpage degli autori).

Materiali aggiuntivi (sia in Italiano che in Inglese) saranno resi disponibili su Aulaweb a cura del docente.

DOCENTI E COMMISSIONI

Commissione d'esame

FABIO RAPALLO (Presidente)

CORRADO LAGAZIO

MARTA NAI RUSCONE

LEZIONI

INIZIO LEZIONI

Il corso segue il calendario di Dipartimento per il secondo semestre.

Orari delle lezioni

L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy

ESAMI

MODALITA' D'ESAME

Qualora l'andamento dell'epidemia COVID consenta gli esami in presenza, l’esame consisterà in una prova scritta, che potrà essere sostituita – per i frequentanti – da due prove intermedie da svolgersi durante il corso.

In caso sia necessario svolgere esami in remoto, gli studenti saranno avvertiti appena possibile della variazione delle modalità d'esame. L'esame in remoto sarà strutturato per quanto possibile come l'esame in presenza.

Il regolamento completo d’esame sarà pubblicato sulla pagina del corso su Aulaweb e tenuto aggiornato in base alle disposizioni normative e regolamentari che via via dovranno esser rispettate.

MODALITA' DI ACCERTAMENTO

L'esame scritto si compone di tre parti:

1) una domanda di carattere generale a risposta aperta

2) una o più domande specifiche a risposta aperta

3) un output da commentare

Le domande sono scelte in modo da coprire, per quanto possibile, tutti gli argomenti del programma d'esame. La domanda generale ha lo scopo di valutare il grado di conoscenza della materia e l’acquisizione del linguaggio tecnico corretto, le domande specifiche sono tese a valutare la capacità critica dello studente, mentre il commento all’output serve a valutarne le capacità di applicazione.

 

 

Calendario appelli

Data appello Orario Luogo Tipologia Note
17/01/2022 09:30 GENOVA Scritto
07/02/2022 09:30 GENOVA Scritto
04/05/2022 14:00 GENOVA Scritto
06/06/2022 15:00 GENOVA Scritto
20/06/2022 15:00 GENOVA Scritto
12/07/2022 15:00 GENOVA Scritto
06/09/2022 15:00 GENOVA Scritto