CODICE 98238 ANNO ACCADEMICO 2023/2024 CFU 6 cfu anno 3 INGEGNERIA GESTIONALE 10716 (L-9) - GENOVA SETTORE SCIENTIFICO DISCIPLINARE ING-INF/05 LINGUA Italiano SEDE GENOVA PERIODO 2° Semestre MATERIALE DIDATTICO AULAWEB PRESENTAZIONE L'insegnamento introduce le tecniche di base per la rappresentazione e l'analisi esplorativa dei dati in ottica di Business Intelligence, con particolare riferimento all’analisi descrittiva e alle metodologie di analisi esplorativa dei dati orientate al supporto alle decisioni in ambito industriale e gestionale. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI L’obiettivo dell'insegnamento è quello di introdurre lo studente ai concetti fondamentali relativi alla EDA (exploratory data analysis) utilizzando come strumento il linguaggio Python e, in particolare, le componenti della libreria SciPy per il trattamento statistico e la visualizzazione dei dati. Il corso fornirà le conoscenze sulle principali tecniche EDA dal punto di vista teorico e svilupperà la parte pratica introducendo i relativi costrutti SciPy per l’analisi e la visualizzazione dei dati. Nell’ambito del corso lo studente acquisirà le competenze per progettare e realizzare semplici applicativi che svolgano funzioni di “cruscotto” e consentano l’analisi e la rappresentazione di elementi contenuti in database. Lo studente svilupperà la capacità di scegliere le migliori modalità di rappresentazione e analisi in relazione ai particolari dati trattati e al compito da eseguire. OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO Lo studente sarà in grado di progettare e realizzare un semplice cruscotto informativo e interattivo a partire da diverse sorgenti di dati. PREREQUISITI Linguaggio di programmazione Python. Concetti pincipali di basi di dati e sistemi informativi. MODALITA' DIDATTICHE Il corso alterna lezioni frontali con sessioni di esercitazioni pratiche al calcolatore utilizzando strumenti di analisi dati (ad es. Scikit-learn) basati sul linguaggio di programmazione Python. Si consigliano gli studenti lavoratori e gli studenti con certificazione di DSA, di disabilità o di altri bisogni educativi speciali di contattare il docente all’inizio del corso per concordare modalità didattiche e d’esame che, nel rispetto degli obiettivi dell’insegnamento, tengano conto delle modalità di apprendimento individuali. PROGRAMMA/CONTENUTO Introduzione a EDA (Exploratory Data Analysis) Dati strutturati e non strutturati Data preprocessing e Data wrangling Key Performance Indicators Data visualizaztion Dashboard design Data warehousing e OLAP Data Quality Data Privacy TESTI/BIBLIOGRAFIA Materiale fornito dal docente Librerie Python: SciPy https://scipy.org e in particolare la libreria Pandas https://pandas.pydata.org Tesi per approfondimenti: C.C.Aggarwal, Data mining: the textbook. Springer, 2015. [Cap.2,3] J.V.Guttag, Introduction to computation and programming using Python. MIT Press, 2013. [Cap. 16] M.J.Zaki, M.Wagner Jr., Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Cambridge University Press, 2019. [Cap. 1-7] S.Few, Information Dashboard Design, 2nd Ed., Analytics Press, 2013. D.Parmenter, Key Performance Indicators, 2nd Ed., 2010. W.McKinney et al., pandas: powerful Python data analysis toolkit, 2021 DOCENTI E COMMISSIONI DAVIDE ANGUITA Ricevimento: Su appuntamento, tramite e-mail ANTONIO EMANUELE CINA' Commissione d'esame DAVIDE ANGUITA (Presidente) LUCA DEMETRIO ANTONIO EMANUELE CINA' (Presidente Supplente) LEZIONI INIZIO LEZIONI https://easyacademy.unige.it/portalestudenti/index.php?view=easycourse&_lang=it&include=corso Orari delle lezioni L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy ESAMI MODALITA' D'ESAME Lo studente svilupperà in autonomia (singolarmente o in cooperazione con altri studenti) un caso di studio a scelta, tra quelli proposti dal docente, utilizzando una delle metodologie illustrate durante il corso. L’esame orale verterà sulla discussione del caso di studio. MODALITA' DI ACCERTAMENTO L'esame orale permetterà di verificare la capacità di analizzare e rappresentare un insieme di dati provenienti da diverse sorgenti in modo da renderli fruibili da un ipotetico utente finale identificato con il caso di studio. Calendario appelli Data appello Orario Luogo Tipologia Note 04/06/2024 08:00 GENOVA Scritto + Orale 20/06/2024 08:00 GENOVA Scritto + Orale 23/07/2024 08:00 GENOVA Scritto + Orale 12/09/2024 08:00 GENOVA Scritto + Orale