Salta al contenuto principale
CODICE 117865
ANNO ACCADEMICO 2025/2026
CFU
SETTORE SCIENTIFICO DISCIPLINARE SECS-S/05
LINGUA Italiano (Inglese a richiesta)
SEDE
  • SAVONA
PERIODO 1° Semestre
MODULI Questo insegnamento è un modulo di:
MATERIALE DIDATTICO AULAWEB

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

Il corso si pone l’obiettivo di fornire agli studenti conoscenze fondamentali in merito alla metodologia della ricerca. Verranno introdotti metodi e strumenti per la raccolta, l’analisi e la visualizzazione dei dati, considerando sia approcci quantitativi sia qualitativi.

MODALITA' DIDATTICHE

Lezioni frontali

PROGRAMMA/CONTENUTO

Lezione 1 – Statistica di base (Analisi monovariata)

  • Concetti fondamentali: popolazione, campione, variabili.

  • Tipi di variabili (nominali, ordinali, quantitative).

  • Indicatori di posizione: media, mediana, moda.

  • Indicatori di variabilità: range, varianza, deviazione standard.

  • Visualizzazioni: istogrammi, boxplot, bar chart.


Lezione 2 – Statistica di base (Analisi bivariata)

  • Correlazione (coefficiente di Pearson, di Spearman).

  • Regressione lineare semplice.

  • Distribuzione normale e proprietà.

  • Campionamento: concetti e metodi.

  • Intervalli di confidenza (per medie e proporzioni).

  • Test di ipotesi: Test Z e Test t.


 

Lezione 3 – Dataset Titanic

Esplorazione iniziale del dataset (Data Understanding)

  • Analisi delle dimensioni del dataset (numero di righe, colonne).
  • Identificazione dei tipi di dati (numerici, categorici, date, ecc.).
  • Visualizzazione delle prime e ultime righe per comprendere la struttura.
  • Controllo dei valori mancanti per colonna.
  • Statistiche descrittive di base (media, mediana, deviazione standard, min/max).

Lezione 4 – Dataset Titanic

Pulizia dei dati (Data Cleaning)

  • Rimozione o gestione dei duplicati.
  • Correzione di errori nei dati (es. valori anomali, formati errati, typo).
  • Trattamento dei valori mancanti:
    • Imputazione (media, mediana, moda, modelli predittivi).
    • Rimozione di colonne o righe con troppi dati mancanti.
  • Gestione di valori inconsistenti (es. "male"/"Male", "S"/"Southampton").

Lezione 5 – Dataset Titanic

Analisi esplorativa (EDA – Exploratory Data Analysis)

  • Distribuzione delle variabili numeriche e categoriche.
  • Analisi della variabile target (es. bilanciamento di Survived).
  • Relazioni tra variabili:
    • Sopravvivenza per genere, classe, età, numero di familiari.
    • Correlazioni tra variabili numeriche.
  • Identificazione di outlier e valori estremi (es. età 0.42, tariffa 0).
  • Analisi di gruppi (famiglie, biglietti condivisi, sopravvivenza collettiva).

Lezione 6 – Dataset Titanic

Feature Engineering

  • Creazione di nuove variabili:
    • Età in fasce (bambino, adulto, anziano).
    • Dimensione della famiglia (SibSp + Parch + 1).
    • Presenza di titoli onorifici nel nome (Mr, Mrs, Miss, Dr, Master, ecc.).
    • Lunghezza del nome o del biglietto come segnale.
    • Categoria del prezzo del biglietto (basso, medio, alto)

Lezione 7 – Dataset Titanic

  • Estrazione di informazioni da campi composti:
    • Lettera della cabina (prima lettera → zona nave).
    • Famiglie con stesso cognome e biglietto.

Lezione 8-9 – Progetto finale

  • Sviluppo completo del workflow:

    • Data Cleaning, Preprocessing, EDA, Analisi inferenziale, Modellazione.

  • Consegna di un report con grafici e interpretazioni.

TESTI/BIBLIOGRAFIA

Verrà indicata durante le lezioni

DOCENTI E COMMISSIONI

Commissione d'esame

FABRIZIO BRACCO (Presidente)

LUCA SABATINI (Presidente Supplente)

LEZIONI

INIZIO LEZIONI

26 settembre 2025

Orari delle lezioni

L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy