Salta al contenuto principale della pagina

ANALISI E RAPPRESENTAZIONE DEI DATI

CODICE 98238
ANNO ACCADEMICO 2022/2023
CFU
  • 6 cfu al 3° anno di 10716 INGEGNERIA GESTIONALE (L-9) - GENOVA
  • SETTORE SCIENTIFICO DISCIPLINARE ING-INF/05
    LINGUA Italiano
    SEDE
  • GENOVA
  • PERIODO 1° Semestre
    MATERIALE DIDATTICO AULAWEB

    PRESENTAZIONE

    Il corso introduce le tecniche di base per la rappresentazione e l'analisi esplorativa dei dati in ottica di Business Intelligence, con particolare riferimento all’analisi descrittiva e alle metodologie di analisi esplorativa dei dati orientate al supporto alle decisioni in ambito industriale e gestionale.

    OBIETTIVI E CONTENUTI

    OBIETTIVI FORMATIVI

    L’obiettivo del corso è quello di introdurre lo studente ai concetti fondamentali relativi alla EDA (exploratory data analysis) utilizzando come strumento il linguaggio Python e, in particolare, le componenti della libreria SciPy per il trattamento statistico e la visualizzazione dei dati. Il corso fornirà le conoscenze sulle principali tecniche EDA dal punto di vista teorico e svilupperà la parte pratica introducendo i relativi costrutti SciPy per l’analisi e la visualizzazione dei dati. Nell’ambito del corso lo studente acquisirà le competenze per progettare e realizzare semplici applicativi che svolgano funzioni di “cruscotto” e consentano l’analisi e la rappresentazione di elementi contenuti in database. Lo studente svilupperà la capacità di scegliere le migliori modalità di rappresentazione e analisi in relazione ai particolari dati trattati e al compito da eseguire.

    OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

    Lo studente sarà in grado di progettare e realizzare un semplice cruscotto informativo e interattivo a partire da diverse sorgenti di dati.

    PREREQUISITI

    Linguaggio di programmazione Python

    Concetti pincipali di basi di dati

    MODALITA' DIDATTICHE

    Il corso alterna lezioni frontali con sessioni di esercitazioni pratiche al calcolatore utilizzando strumenti di analisi dati (ad es. Scikit-learn) basati sul linguaggio di programmazione Python.

    PROGRAMMA/CONTENUTO

    Introduzione a EDA (Exploratory Data Analysis)

    Dati strutturati e non strutturati

    Data preprocessing e Data wrangling

    Key Performance Indicators

    Data visualizaztion

    Dashboard design

    Data warehousing e OLAP

    Data Quality

    Data Privacy

    TESTI/BIBLIOGRAFIA

    Materiale fornito dal docente

    Librerie Python: SciPy https://scipy.org e in particolare la libreria Pandas https://pandas.pydata.org

    Tesi per approfondimenti:

    • C.C.Aggarwal, Data mining: the textbook. Springer, 2015. [Cap.2,3]
    • J.V.Guttag, Introduction to computation and programming using Python. MIT Press, 2013. [Cap. 16]
    • M.J.Zaki, M.Wagner Jr., Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Cambridge University Press, 2019. [Cap. 1-7]
    • S.Few, Information Dashboard Design, 2nd Ed., Analytics Press, 2013.
    • D.Parmenter, Key Performance Indicators, 2nd Ed., 2010. 
    • W.McKinney et al., pandas: powerful Python data analysis toolkit, 2021

    DOCENTI E COMMISSIONI

    Commissione d'esame

    DAVIDE ANGUITA (Presidente)

    ALBERTO OLIVERI

    FABIO ROLI

    LUCA ONETO (Presidente Supplente)

    LEZIONI

    Orari delle lezioni

    L'orario di tutti gli insegnamenti è consultabile su EasyAcademy.

    ESAMI

    MODALITA' D'ESAME

    Lo studente svilupperà in autonomia (singolarmente o in cooperazione con altri studenti) un caso di studio a scelta, tra quelli proposti dal docente, utilizzando una delle metodologie illustrate durante il corso. L’esame orale verterà sulla discussione del caso di studio.

    MODALITA' DI ACCERTAMENTO

    L'esame orale permetterà di verificare la capacità di analizzare e rappresentare un insieme di dati provenienti da diverse sorgenti in modo da renderli fruibili da un ipotetico utente finale identificato con il caso di studio.

    Calendario appelli

    Data Ora Luogo Tipologia Note