CODICE 117865 ANNO ACCADEMICO 2025/2026 CFU 6 cfu anno 1 DIGITAL HUMANITIES - INTERACTIVE SYSTEMS AND DIGITAL MEDIA 11945 (LM-92 R) - SAVONA SETTORE SCIENTIFICO DISCIPLINARE SECS-S/05 LINGUA Italiano (Inglese a richiesta) SEDE SAVONA PERIODO 1° Semestre MODULI Questo insegnamento è un modulo di: METODI QUALI-QUANTITATIVI PER LE DIGITAL HUMANITIES E LA USER EXPERIENCE MATERIALE DIDATTICO AULAWEB OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI Il corso si pone l’obiettivo di fornire agli studenti conoscenze fondamentali in merito alla metodologia della ricerca. Verranno introdotti metodi e strumenti per la raccolta, l’analisi e la visualizzazione dei dati, considerando sia approcci quantitativi sia qualitativi. MODALITA' DIDATTICHE Lezioni frontali PROGRAMMA/CONTENUTO Lezione 1 – Statistica di base (Analisi monovariata) Concetti fondamentali: popolazione, campione, variabili. Tipi di variabili (nominali, ordinali, quantitative). Indicatori di posizione: media, mediana, moda. Indicatori di variabilità: range, varianza, deviazione standard. Visualizzazioni: istogrammi, boxplot, bar chart. Lezione 2 – Statistica di base (Analisi bivariata) Correlazione (coefficiente di Pearson, di Spearman). Regressione lineare semplice. Distribuzione normale e proprietà. Campionamento: concetti e metodi. Intervalli di confidenza (per medie e proporzioni). Test di ipotesi: Test Z e Test t. Lezione 3 – Dataset Titanic Esplorazione iniziale del dataset (Data Understanding) Analisi delle dimensioni del dataset (numero di righe, colonne). Identificazione dei tipi di dati (numerici, categorici, date, ecc.). Visualizzazione delle prime e ultime righe per comprendere la struttura. Controllo dei valori mancanti per colonna. Statistiche descrittive di base (media, mediana, deviazione standard, min/max). Lezione 4 – Dataset Titanic Pulizia dei dati (Data Cleaning) Rimozione o gestione dei duplicati. Correzione di errori nei dati (es. valori anomali, formati errati, typo). Trattamento dei valori mancanti: Imputazione (media, mediana, moda, modelli predittivi). Rimozione di colonne o righe con troppi dati mancanti. Gestione di valori inconsistenti (es. "male"/"Male", "S"/"Southampton"). Lezione 5 – Dataset Titanic Analisi esplorativa (EDA – Exploratory Data Analysis) Distribuzione delle variabili numeriche e categoriche. Analisi della variabile target (es. bilanciamento di Survived). Relazioni tra variabili: Sopravvivenza per genere, classe, età, numero di familiari. Correlazioni tra variabili numeriche. Identificazione di outlier e valori estremi (es. età 0.42, tariffa 0). Analisi di gruppi (famiglie, biglietti condivisi, sopravvivenza collettiva). Lezione 6 – Dataset Titanic Feature Engineering Creazione di nuove variabili: Età in fasce (bambino, adulto, anziano). Dimensione della famiglia (SibSp + Parch + 1). Presenza di titoli onorifici nel nome (Mr, Mrs, Miss, Dr, Master, ecc.). Lunghezza del nome o del biglietto come segnale. Categoria del prezzo del biglietto (basso, medio, alto) Lezione 7 – Dataset Titanic Estrazione di informazioni da campi composti: Lettera della cabina (prima lettera → zona nave). Famiglie con stesso cognome e biglietto. Lezione 8-9 – Progetto finale Sviluppo completo del workflow: Data Cleaning, Preprocessing, EDA, Analisi inferenziale, Modellazione. Consegna di un report con grafici e interpretazioni. TESTI/BIBLIOGRAFIA Verrà indicata durante le lezioni DOCENTI E COMMISSIONI LUCA SABATINI Ricevimento: Prima o dopo le lezioni meglio se su appuntamento (scrivere a luca.sabatini@unige.it) Commissione d'esame FABRIZIO BRACCO (Presidente) LUCA SABATINI (Presidente Supplente) LEZIONI INIZIO LEZIONI 26 settembre 2025 Orari delle lezioni L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy