Salta al contenuto principale
CODICE 98238
ANNO ACCADEMICO 2022/2023
CFU
SETTORE SCIENTIFICO DISCIPLINARE ING-INF/05
LINGUA Italiano
SEDE
  • GENOVA
PERIODO 1° Semestre
MATERIALE DIDATTICO AULAWEB

PRESENTAZIONE

Il corso introduce le tecniche di base per la rappresentazione e l'analisi esplorativa dei dati in ottica di Business Intelligence, con particolare riferimento all’analisi descrittiva e alle metodologie di analisi esplorativa dei dati orientate al supporto alle decisioni in ambito industriale e gestionale.

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

L’obiettivo del corso è quello di introdurre lo studente ai concetti fondamentali relativi alla EDA (exploratory data analysis) utilizzando come strumento il linguaggio Python e, in particolare, le componenti della libreria SciPy per il trattamento statistico e la visualizzazione dei dati. Il corso fornirà le conoscenze sulle principali tecniche EDA dal punto di vista teorico e svilupperà la parte pratica introducendo i relativi costrutti SciPy per l’analisi e la visualizzazione dei dati. Nell’ambito del corso lo studente acquisirà le competenze per progettare e realizzare semplici applicativi che svolgano funzioni di “cruscotto” e consentano l’analisi e la rappresentazione di elementi contenuti in database. Lo studente svilupperà la capacità di scegliere le migliori modalità di rappresentazione e analisi in relazione ai particolari dati trattati e al compito da eseguire.

OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

Lo studente sarà in grado di progettare e realizzare un semplice cruscotto informativo e interattivo a partire da diverse sorgenti di dati.

PREREQUISITI

Linguaggio di programmazione Python

Concetti pincipali di basi di dati

MODALITA' DIDATTICHE

Il corso alterna lezioni frontali con sessioni di esercitazioni pratiche al calcolatore utilizzando strumenti di analisi dati (ad es. Scikit-learn) basati sul linguaggio di programmazione Python.

PROGRAMMA/CONTENUTO

Introduzione a EDA (Exploratory Data Analysis)

Dati strutturati e non strutturati

Data preprocessing e Data wrangling

Key Performance Indicators

Data visualizaztion

Dashboard design

Data warehousing e OLAP

Data Quality

Data Privacy

TESTI/BIBLIOGRAFIA

Materiale fornito dal docente

Librerie Python: SciPy https://scipy.org e in particolare la libreria Pandas https://pandas.pydata.org

Tesi per approfondimenti:

  • C.C.Aggarwal, Data mining: the textbook. Springer, 2015. [Cap.2,3]
  • J.V.Guttag, Introduction to computation and programming using Python. MIT Press, 2013. [Cap. 16]
  • M.J.Zaki, M.Wagner Jr., Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Cambridge University Press, 2019. [Cap. 1-7]
  • S.Few, Information Dashboard Design, 2nd Ed., Analytics Press, 2013.
  • D.Parmenter, Key Performance Indicators, 2nd Ed., 2010. 
  • W.McKinney et al., pandas: powerful Python data analysis toolkit, 2021

DOCENTI E COMMISSIONI

Commissione d'esame

DAVIDE ANGUITA (Presidente)

ALBERTO OLIVERI

FABIO ROLI

LUCA ONETO (Presidente Supplente)

LEZIONI

Orari delle lezioni

L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy

ESAMI

MODALITA' D'ESAME

Lo studente svilupperà in autonomia (singolarmente o in cooperazione con altri studenti) un caso di studio a scelta, tra quelli proposti dal docente, utilizzando una delle metodologie illustrate durante il corso. L’esame orale verterà sulla discussione del caso di studio.

MODALITA' DI ACCERTAMENTO

L'esame orale permetterà di verificare la capacità di analizzare e rappresentare un insieme di dati provenienti da diverse sorgenti in modo da renderli fruibili da un ipotetico utente finale identificato con il caso di studio.