Salta al contenuto principale
CODICE 52480
ANNO ACCADEMICO 2024/2025
CFU
SETTORE SCIENTIFICO DISCIPLINARE SECS-S/01
LINGUA Italiano
SEDE
  • GENOVA
PERIODO 2° Semestre
MATERIALE DIDATTICO AULAWEB

PRESENTAZIONE

L’insegnamento introduce lo studente all’analisi statistica descrittiva di dati multivariati, puntualizzando le metodologie utilizzate da un punto di vista teorico e sviluppando le competenze essenziali per l’interpretazione dei dati oggetto di indagine. Parte integrante sono le esercitazioni in laboratorio.

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

L’insegnamento introduce lo studente all’analisi statistica descrittiva di dati multivariati, puntualizzando le metodologie utilizzate da un punto di vista teorico e sviluppando le competenze essenziali per l’interpretazione dei dati oggetto di indagine. Parte integrante sono le esercitazioni in laboratorio.

OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

L'analisi descrittiva (o esplorativa) dei dati comprende quelle tecniche che permettono di riassumerne le caratteristiche principali, spesso con strumenti grafici. Questo è il primo e fondamentale passo di ogni analisi statistica. Le metodologie necessarie, specie quelle multivariate, richiedono strumenti matematici, in particolare algebrici e geometrici, che vengono sviluppati in insegnamenti svolti in parallelo.

I principali obiettivi formativi del corso sono pertanto:

- applicare le principali metodologie per l’analisi dei dati univariati e multivariati in un ottica descrittiva

- identificare le caratteristiche di un dataset attraverso la scelta e il calcolo di opportuni indici statistici

- analizzare un dataset, attraverso l'uso di appropriate metodologie statistiche più complesse come la Cluster Analysis, l'Analisi delle Componenti Principali e il Modello Lineare Classico.

Obiettivi non secondari dell'insegnamento riguardano il raggiungimento di competenze trasversali, quali la capacità di lavorare in gruppo, la capacità di redarre relazioni con i risultati delle analisi statistiche e la formazione di una mentalità flessibile che permetta di adattarsi facilmente a nuove situazioni. Queste competenze sono sviluppate a partire dalle attività di laboratorio informatico, dove si potenziano anche abiltà informatiche tramite l’uso del software R per l'analisi di dati.

Partecipando alle attività di gruppo previste, alla fine del corso lo studente avrà anche acquisito le seguenti competenze a livello base:

  • alfabetico-funzionale (compilazione di elaborati prodotti in gruppo) 
  • competenza in creazione progettuale (scelta degli strumenti matematico/statistici appropriati e dello stile di presentazione dell'analisi effettuata sui dataset proposti)
  • capacità di imparare a imparare (approfondendo argomenti essenziali per l'analisi)
  • competenza sociale (implicate dalla quantità e dalle tipologie di scelte che il gruppo deve fare)

MODALITA' DIDATTICHE

L'insegnamento consta di circa 50 ore di lezioni in aula (comprensive di teoria ed esercizi alla lavagna) e di circa 24 ore di esercitazioni in laboratorio informatico. Sono previste inoltre circa 8 ore di esercitazioni guidate in aula.

Finalità delle esercitazioni in laboratorio è, oltre all'acquisizione di un linguaggio di programmazione orientato alla statistica, l'applicazione delle metodologie statistiche presentate a lezione per interpretare i dati oggetto di indagine; questa attività dovrebbe permettere allo studente anche di verificare il livello di comprensione della teoria statistica appresa e del suo uso pratico.

Le esercitazioni guidate in aula consistono nello svolgimento di esercizi da parte degli studenti (anche a gruppi) direttamente in aula in momenti dedicati; la presenza dei docenti e dei tutor in aula dovrebbe permette di chiarire dubbi e superare eventuali difficoltà sorte nello svolgimento.

PROGRAMMA/CONTENUTO

Statistica univariata e bivariata.
Variabili qualitative. Frequenze assolute e relative, legge di una variabile, legge congiunta e leggi marginali di due variabili, leggi condizionate (profili riga e profili colonna), indipendenza; rappresentazioni grafiche.
Variabili quantitative. Funzioni di distribuzione, di distribuzione cumulata e dei quantili e loro rappresentazioni grafiche; indici di centralità e dispersione basati sui momenti e sui quantili e loro proprietà legati alle metriche L1 e L2. Media aritmetica (con proprietà) e Varianza (con proprietà) di una variabile quantitativa. Covarianza (con proprietà) e Correlazione (con proprietà) tra due variabili quantitative. Interpretazione geometrica di varianza, covarianza, correlazione.

Statistica multivariata.
Cluster analysis. Aggregazione gerarchica secondo la distanza e secondo l’inerzia. Indici di aggregazione e dendrogramma. Semimetrica. Aggregazione non gerarchica (centri mobili e k-means, termine del processo di aggregazione, scelta dei punti iniziali, raggruppamenti stabili). Aggregazione delle variabili.
Analisi in componenti principali. Rappresentazione di n dati quantitativi multivariati (punti riga della matrice dei dati, in Rp) in uno spazio vettoriale di dimensione ridotta e fedeltà della rappresentazione.  Cambio di base (autovettori della matrice di correlazione). Proprietà delle nuove variabili. Altra interpretazione geometrica della correlazione fra variabili e corrispondente rappresentazione grafica.
Regressione multipla. Spazio vettoriale generato dalle variabili esplicative (punti colonna della matrice dei dati, in Rn). Minimi quadrati lineari e significato geometrico della minimizzazione dei residui. Significato geometrico della decomposizione della varianza della variabile risposta (in Rn). Bontà del modello: grafico dei residui e indice R-sq (e sua interpretazione geometrica). Analisi della varianza a una via e decomposizione in varianza fra e dentro i gruppi.

Esercitazioni al calcolatore con il software R

TESTI/BIBLIOGRAFIA

M. P. Rogantin (2016) Statistica descrittiva
(dispense disponibili su AulaWeb e al link http://www.dima.unige.it/~rogantin/StDescrittiva2/StatDescrittiva.pdf)

Maindonald J., Braun W. J, (2010). Data analysis and graphics using R: an example-based approach. 3. ed. Cambridge University press

I.T. Jolliffe (2002). Principal Component Analysis. Springer Series in Statistics

DOCENTI E COMMISSIONI

Commissione d'esame

FRANCESCO PORRO (Presidente)

SARA SOMMARIVA

EVA RICCOMAGNO (Presidente Supplente)

ALBERTO SORRENTINO (Presidente Supplente)

LEZIONI

INIZIO LEZIONI

Dal 17 febbraio 2025 secondo l'orario riportato qui 

Orari delle lezioni

L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy

ESAMI

MODALITA' D'ESAME

L'esame è articolato in tre parti:

  • prova scritta
  • relazioni delle ultime due esercitazioni svolte in laboratorio
  • prova orale

La prova scritta vale al massimo 20 punti, le relazioni al massimo 10 punti.

Si accede all'orale se il voto della prova scritta è maggiore o uguale a 12 e se la somma dei voti delle relazioni e della prova scritta è maggiore o uguale a 18.

 

Per gli studenti con disabilità o con DSA si rimanda alla sezione Altre Informazioni.

MODALITA' DI ACCERTAMENTO

Prova scritta
La prova scritta è finalizzata a verificare l'abilità di svolgere esercizi, di tipo sia calcolativo che interpretativo di analisi di dati. In quest'ottica è anche richiesto il commento di parti di output ottenuti con il software R.
La prova scritta può essere sostituita da due prove intermedie (compitini), se l’esito di entrambe è positivo (≥ 12); il primo compitino viene svolto durante il periodo delle lezioni, il secondo compitino viene svolto contemporaneamente alla prima prova scritta finale (giugno).

Relazioni delle esercitazioni svolte in laboratorio
Le relazioni sono volte a valutare la capacità di effettuare analisi descrittive di insiemi di dati sulla base delle metodologie matematico statistiche sviluppate nell'insegnamento. La valutazione tiene conto sia dell'uso appropriato di tali metodologie, sia della capacità di analizzare criticamente i problemi, sia della padronanza delle tecniche espositive con una particolare attenzione alla proprietà di linguaggio.
Le relazioni concorrono al voto finale con la media dei voti delle singole relazioni solo se il voto della prova scritta è maggiore o uguale a 12. Per i frequentanti, la frequenza alle esercitazioni in laboratorio deve essere almeno dell’80%.
Le relazioni vanno consegnate ai docenti una decina di giorni dopo la fine dello svolgimento delle attività in laboratorio (le date precise sono indicate su AulaWeb).
Gli studenti che non possono frequentare devono comunque svolgere le relazioni (concordando le tempistiche di consegna con i docenti) e devono svolgere una parte suppletiva di programma (le modalità specifiche sono da concordare con i docenti).

Prova orale
È volta a verificare il livello di comprensione generale degli aromenti trattati e delle metodologie specifiche, compresa la padronanza delle dimostrazioni dei risultati ottenuti.

ALTRE INFORMAZIONI

Si ricorda alle studentesse e agli studenti con disabilità o con disturbi specifici dell'apprendimento (DSA) che per poter richiedere adattamenti in sede d'esame occorre prima inserire la certificazione sul sito web di Ateneo alla pagina servizionline.unige.it nella sezione “Studenti”. La documentazione sarà verificata dal Settore servizi per l’inclusione degli studenti con disabilità e con DSA dell’Ateneo, come indicato sul sito federato al link: STATISTICA MATEMATICA E TRATTAMENTO INFORMATICO DEI DATI 8766 | Studenti con disabilità e/o DSA | UniGe | Università di Genova | Corsi di Studio UniGe

Successivamente, con significativo anticipo (almeno 10 giorni) rispetto alla data di esame occorre inviare una e-mail al/alla docente con cui si sosterrà la prova di esame, inserendo in copia conoscenza sia il docente Referente di Scuola per l'inclusione degli studenti con disabilità e con DSA (sergio.didomizio@unige.it) sia il Settore sopra indicato. Nella e-mail occorre specificare:

•            la denominazione dell’insegnamento

•            la data dell'appello

•            il cognome, nome e numero di matricola dello studente

•            gli strumenti compensativi e le misure dispensative ritenuti funzionali e richiesti.

Il/la referente confermerà al/alla docente che il/la richiedente ha diritto a fare richiesta di adattamenti in sede d'esame e che tali adattamenti devono essere concordati con il/la docente. Il/la docente risponderà comunicando se sia possibile utilizzare gli adattamenti richiesti.

Le richieste devono essere inviate almeno 10 giorni prima della data dell’appello al fine di consentire al/alla docente di valutarne il contenuto. In particolare, nel caso in cui si intenda usufruire di mappe concettuali per l’esame (che devono essere molto più sintetiche rispetto alle mappe usate per lo studio) se l’invio non rispetta i tempi previsti non vi sarà il tempo tecnico necessario per apportare eventuali modifiche.

Per ulteriori informazioni in merito alla richiesta di servizi e adattamenti consultare il documento: Linee guida per la richiesta di servizi, di strumenti compensativi e/o di misure dispensative e di ausili specifici

 

Agenda 2030

Agenda 2030
Istruzione di qualità
Istruzione di qualità
Parità di genere
Parità di genere