CODICE 98238 ANNO ACCADEMICO 2021/2022 CFU 6 cfu anno 3 INGEGNERIA GESTIONALE 10716 (L-9) - GENOVA SETTORE SCIENTIFICO DISCIPLINARE ING-INF/05 LINGUA Italiano SEDE GENOVA PERIODO 2° Semestre MATERIALE DIDATTICO AULAWEB PRESENTAZIONE Il corso introduce le tecniche di base per la rappresentazione e l'analisi esplorativa dei dati in ottica di Business Intelligence. OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI L’obiettivo del corso è quello di introdurre lo studente ai concetti fondamentali relativi alla EDA (exploratory data analysis) utilizzando come strumento il linguaggio Python e, in particolare, le componenti della libreria SciPy per il trattamento statistico e la visualizzazione dei dati. Il corso fornirà le conoscenze sulle principali tecniche EDA dal punto di vista teorico e svilupperà la parte pratica introducendo i relativi costrutti SciPy per l’analisi e la visualizzazione dei dati. Nell’ambito del corso lo studente acquisirà le competenze per progettare e realizzare semplici applicativi che svolgano funzioni di “cruscotto” e consentano l’analisi e la rappresentazione di elementi contenuti in database. Lo studente svilupperà la capacità di scegliere le migliori modalità di rappresentazione e analisi in relazione ai particolari dati trattati e al compito da eseguire. OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO Lo studente sarà in grado di progettare e realizzare un semplice cruscotto informativo e interattivo a partire da diverse sorgenti di dati. PREREQUISITI Linguaggio di programmazione Python Concetti pincipali di basi di dati MODALITA' DIDATTICHE Lezioni teoriche ed esercitazioni pratiche al calcolatore. PROGRAMMA/CONTENUTO Introduzione a EDA (Exploratory Data Analysis) Dati strutturati e non strutturati Data preprocessing e Data wrangling Key Performance Indicators Data visualizaztion Dashboard design Data warehousing e OLAP Data Quality Data Privacy TESTI/BIBLIOGRAFIA Materiale fornito dal docente Librerie Python: SciPy https://scipy.org e in particolare la libreria Pandas https://pandas.pydata.org Tesi per approfindimenti: C.C.Aggarwal, Data mining: the textbook. Springer, 2015. [Cap.2,3] J.V.Guttag, Introduction to computation and programming using Python. MIT Press, 2013. [Cap. 16] M.J.Zaki, M.Wagner Jr., Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Cambridge University Press, 2019. [Cap. 1-7] S.Few, Information Dashboard Design, 2nd Ed., Analytics Press, 2013. D.Parmenter, Key Performance Indicators, 2nd Ed., 2010. W.McKinney et al., pandas: powerful Python data analysis toolkit, 2021 DOCENTI E COMMISSIONI DAVIDE ANGUITA Ricevimento: Su appuntamento, tramite e-mail LUCA ONETO Ricevimento: Su appuntamento, tramite e-mail Commissione d'esame DAVIDE ANGUITA (Presidente) ARMANDO TACCHELLA LUCA ONETO (Presidente Supplente) LEZIONI INIZIO LEZIONI https://corsi.unige.it/10716/p/studenti-orario Orari delle lezioni L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy ESAMI MODALITA' D'ESAME Lo studente svilupperà in autonomia (singolarmente o in cooperazione con altri studenti) un caso di studio a scelta, tra quelli proposti dal docente, utilizzando una delle metodologie illustrate durante il corso. L’esame orale verterà sulla discussione del caso di studio. MODALITA' DI ACCERTAMENTO L'esame orale permetterà di verificare la capacità di analizzare e rappresentare un insieme di dati provenienti da diverse sorgenti in modo da renderli fruibili da un ipotetico utente finale identificato con il caso di studio. Calendario appelli Data appello Orario Luogo Tipologia Note 18/01/2022 08:00 GENOVA Esame su appuntamento 18/01/2022 08:00 GENOVA Orale 16/02/2022 08:00 GENOVA Esame su appuntamento 16/02/2022 08:00 GENOVA Orale 01/06/2022 08:00 GENOVA Esame su appuntamento 01/06/2022 08:00 GENOVA Orale 20/06/2022 08:00 GENOVA Esame su appuntamento 20/06/2022 08:00 GENOVA Orale 22/07/2022 08:00 GENOVA Esame su appuntamento 22/07/2022 08:00 GENOVA Orale 13/09/2022 08:00 GENOVA Esame su appuntamento 13/09/2022 08:00 GENOVA Orale