Salta al contenuto principale
CODICE 41601
ANNO ACCADEMICO 2025/2026
CFU
SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01
LINGUA Inglese
SEDE
  • GENOVA
PERIODO 2° Semestre
PROPEDEUTICITA
Propedeuticità in ingresso
Per sostenere l'esame di questo insegnamento è necessario aver sostenuto i seguenti esami:
  • ECONOMICS AND DATA SCIENCE 11267 (coorte 2025/2026)
  • SOFTWARE R 106839 2025
  • ECONOMICS AND DATA SCIENCE 11937 (coorte 2025/2026)
  • SOFTWARE R 106839 2025

PRESENTAZIONE

L'insegnamento di “Statistical learning” tratta gli elementi fondamentali dell’apprendimento statistico sia supervisionato che non-supervisionato. Viene fornita un’ampia panoramica di tecniche di apprendimento: modelli di regressione, modelli lineari generalizzati, algoritmi non parametrici di regressione e classificazione, metodi di selezione del modello, tecniche non supervisionate (cluster analysis e analisi in componenti principali).

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

L'insegnamento si propone di fornire una precisa panoramica delle principali tecniche di apprendimento statistico, sia supervisionato che non-supervisionato. Al fine di permettere una piena comprensione della metodologia delle tecniche di apprendimento statistico, l'insegnamento prevede una prima parte incentrata sulla inferenza statistica sia dal punto di vista parametrico (verosimiglianza) che non parametrico (simulazione e bootstrap). Nel campo dell'apprendimento supervisionato si analizzano le principali tecniche di regressione e classificazione, sia in ambito parametrico (regressione e modelli lineari generalizzati) che in ambito non-parametrico. Nel campo dell'apprendimento non-supervisionato si analizzano invece il clustering e le tecniche di riduzione della dimensionalità. I temi trattati e gli esempi presentati permettono agli studenti di conoscere le tecniche con buona padronanza della metodologia statistica, di affrontare in autonomia problemi di analisi dati e di previsione, di applicare le tecniche apprese in contesti differenti e in particolare nelle scienze economiche.

OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

L’insegnamento è articolato in tre parti:

  1. Elementi di statistica inferenziale parametrica e non-parametrica: inferenza per massima verosimiglianza e modelli di classe esponenziale; stima attraverso tecniche di simulazione Monte Carlo e tecniche bootstrap.

  2. Apprendimento supervisionato: Regressione multipla, introduzione alla teoria dei modelli lineari generalizzati (regressione logistica e per conteggi), alcune tecniche non-parametriche di regressione e classificazione. Tecniche diagnostiche e metodi di selezione del modello.

  3. Apprendimento non-supervisionato: Cluster analysis, analisi in componenti principali.

Tutti gli argomenti saranno accompagnati da esercizi pratici in R, in modo che lo studente possa affiancare alla comprensione degli argomenti trattati anche la capacità di applicare corrette analisi statistiche in contesti reali e di comprendere gli output delle procedure statistiche.

Conoscenza e comprensione: Gli studenti dovranno conoscere le principali tecniche e i principali strumenti di apprendimento statistico. Dovranno essere in grado di inquadrare tali strumenti in termini generali (sia teorici che applicati), e di analizzarne gli strumenti matematici e statistici sottostanti.

Capacità di applicare conoscenza e comprensione: Gli studenti saranno in grado di individuare, di fronte a problemi applicati in diversi contesti, la corretta tecnica di analisi. Inoltre, saranno in grado di valutare criticamente i risultati ottenuti tramite software statistico.

Autonomia di giudizio: Gli studenti dovranno acquisire consapevolezza delle potenzialità e dei limiti delle tecniche statistiche presentate, attraverso l’analisi di esempi e studio di casi.

Abilità comunicative: Gli studenti dovranno saper utilizzare il linguaggio tecnico-statistico corretto per la comunicazione dei risultati e per la descrizione delle tecniche utilizzate.

Capacità di apprendimento: Gli studenti svilupperanno adeguate capacità di apprendimento che consentano loro di continuare ad approfondire in modo autonomo altri aspetti della materia e diversi campi di applicazione rispetto a quelli illustrati. Inoltre, dovranno poter utilizzare anche autonomamente il software R.

PREREQUISITI

Le competenze tipiche fornite dagli insegnamenti introduttivi di Matematica Generale e di Statistica per lauree triennali di ambito economico o aziendale. Saranno inoltre richieste capacità operative nei seguenti argomenti: (a) calcolo di massimi e minimi per funzioni di più variabili; (b) operazioni tra matrici e calcolo di autovalori e autovettori; (c) elementi di base di utilizzo del software R.

 

MODALITA' DIDATTICHE

Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio. Circa un terzo delle lezioni (24 ore) si svolgerà in laboratorio informatico.

Gli studenti in possesso di certificazione di disabilità, DSA o bisogni educativi speciali devono contattare, all’inizio delle lezioni, sia il docente, sia il referente per la disabilità del Dipartimento, Prof.ssa Serena Scotto (scotto@economia.unige.it), per concordare modalità didattiche e d'esame che, nel rispetto degli obiettivi dell’insegnamento, tengano conto delle modalità di apprendimento individuali e consentano l'uso di eventuali strumenti compensativi.

PROGRAMMA/CONTENUTO

0. Introduzione e richiami di calcolo delle probabilità.

1. Verosimiglianza. Stima per massima verosimiglianza. Informazione. La famiglia esponenziale. Esempi per distribuzioni parametriche discrete e continue.

2. Distribuzioni multivariate: la normale multivariata.

3. Simulazione Monte Carlo e bootstrap.

4. Regressione lineare multipla. Diagnostica per i modelli di regressione.

5. Modelli lineari generalizzati: Regressione logistica e regressione per conteggi.

6. Tecniche non-parametriche di regressione e classificazione.

7. Metodi di selezione del modello.

8. Cluster analysis.

9. Analisi in componenti principali.

TESTI/BIBLIOGRAFIA

Evans, Rosenthal. Probability and Statistics. The Science of Uncertainty, Second edition, 2023 (disponibile sulla webpage degli autori).

James, Witten, Hastie and Tibshirani. An Introduction to Statistical Learning. With Applications in R. Springer, 2023 (disponibile sulla webpage degli autori).

Hastie, Tibshirani, Friedman. The Elements of Statistical Learning. Springer Springer, 2017 (disponibile sulla webpage degli autori).

Materiali aggiuntivi saranno resi disponibili su Aulaweb a cura del docente.

DOCENTI E COMMISSIONI

LEZIONI

INIZIO LEZIONI

L'insegnamento inizia nella prima settimana di lezioni del calendario di Dipartimento per il secondo semestre.

Orari delle lezioni

L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy

ESAMI

MODALITA' D'ESAME

Studenti frequentanti:

L’esame consiste nella redazione di relazioni su tre esercitazioni di analisi dati in R e successiva discussione. Una esercitazione verte sui metodi Monte Carlo e bootstrap, una sull’apprendimento supervisionato, una sull’apprendimento non supervisionato.

Studenti non frequentanti:

L’esame è scritto e consiste in tre domande relative al programma d’esame e riferite ai libri di testo indicati in bibliografia. Il syllabus con la corrispondenza tra gli argomenti in programma e i libri di testo sarà reso disponibile su AulaWeb prima dell’inizio dell’insegnamento.

Il regolamento completo di esame sarà disponibile sulla pagina AulaWeb prima dell’inizio delle lezioni.

MODALITA' DI ACCERTAMENTO

Le esercitazioni in R per studenti frequentanti devono dimostrare: a) la padronanza delle tecniche statistiche utilizzate; b) l’adeguatezza e la correttezza nell’interpretazione degli output ottenuti; c) la capacità di inquadrare l’analisi statistica effettuata nell’ambito della applicazione proposta; d) qualora necessario, la capacità di utilizzare consapevolmente metodi statistici non presentati durante le lezioni. Durante la discussione delle relazioni, gli studenti devono dimostrare: a) di saper utilizzare correttamente il linguaggio tecnico della statistica; b) di conoscere i fondamenti metodologici che sono alla base delle tecniche utilizzate per l’analisi dei dati.

Le domande che compongono l’esame scritto per studenti non frequentanti sono scelte in modo da coprire, per quanto possibile, tutti gli argomenti del programma d'esame. Le domande proposte hanno lo scopo di valutare il grado di conoscenza della materia, l’acquisizione del linguaggio tecnico corretto, la capacità critica dello studente e la capacità di inquadrare i risultati statistici nell’ambito di problemi concreti di analisi di dati.

ALTRE INFORMAZIONI

Gli studenti sono invitati a consultare con regolarità la pagina AulaWeb dell’insegnamento, in cui sarà reso disponibile tutto il materiale utile allo studio della parte teorica e allo svolgimento delle esercitazioni di laboratorio R.