Salta al contenuto principale della pagina

INTRODUZIONE ALLA DATA SCIENCE

CODICE 101747
ANNO ACCADEMICO 2020/2021
CFU
  • 6 cfu al 3° anno di 8759 INFORMATICA (L-31) - GENOVA
  • SETTORE SCIENTIFICO DISCIPLINARE INF/01
    LINGUA Italiano
    SEDE
  • GENOVA
  • PERIODO 2° Semestre
    MATERIALE DIDATTICO AULAWEB

    PRESENTAZIONE

    Il corso consiste in una serie di attività collegate tra loro mirate ad introdurre temi generali legati all’area della Data Science e Data Engineering In particolare vedremo una panoramica legata alla costruzione di sistemi ed applicazioni informatiche per la raccolta, gestione, analisi e visualizzazione di dati. Ogni attività sarà costituita da alcune lezioni, seminari informativi e attività laboratoriale 

    OBIETTIVI E CONTENUTI

    OBIETTIVI FORMATIVI

    Introduzione a strumenti utile nell'area della Data Science come Python e librerie collegate (itertools, numpy, scipy, ecc) ed esempi di applicazioni dell'informatica e della statistica all'analisi di dati

    OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

    Il corso ha un molteplici obiettivo

    - introdurre all'uso di strumenti molto usati nell'ambito della Data Science come il linguaggio Python,  Jupyter Notebook, Google Colab, librerie di analisi e visualizzazione di dati e grafi;

    - introdurre alcuni concetti e metodi comunemente usati per l'analisi di dati (PCA, clustering, time series, ecc)

    - mostrare esempi e ambiti applicativi della data science attraverso seminari e laboratori

    I risultati di apprendimento vengono valutati in base ad attività di laboratorio e presentazioni da parte degli studenti

    PREREQUISITI

    Programmazione
    Matematica e statistica di base
     

    MODALITA' DIDATTICHE

    Lezioni frontali
    Briefing su esercitazioni di laboratorio e soluzioni proposte dagli studenti
    Consegna di 5 esercitazioni proposte durante il corso e di un esercizio finale riepilogativo 

     

    PROGRAMMA/CONTENUTO

    Introduzione a Python

    Costrutti

    Immagini e matrici

    Dizionari

    Scoping e Classi

    Ereditarietà ed Eccezioni

    Pandas

    Iteratori/generatori, map, reduce

    Analisi di dati:

    - itertools

    - scipy

    - pca

    - regressione lineareNotebook Grafici e Regressione LineareURL

    - clustering (combinazione KNN e PCA)

    - time series

    Data visualization:

    - GeoPandas

    - Plotly

    Grafi con NetworkX

    Introduzione a sistemi distribuiti, HPC e Big Data

    Introduzione a Internet of Things/Edge Computing

    TESTI/BIBLIOGRAFIA

    Lucidi, lezioni registrate e note messe a dispozione dai docenti
    Introduzione alla Programmazione in Python - Apogeo
    Big Data Analysis - Apogeo

    DOCENTI E COMMISSIONI

    Commissione d'esame

    GIORGIO DELZANNO (Presidente)

    BARBARA CATANIA

    GIOVANNA GUERRINI

    NICOLETTA NOCETI

    LEZIONI

    INIZIO LEZIONI

    Febbraio 2021

    Orari delle lezioni

    L'orario di tutti gli insegnamenti è consultabile su EasyAcademy.

    ESAMI

    MODALITA' D'ESAME

    L'esame consiste in un quiz online e una presentazione (in presenza o remoto) dei laboratori consegnati durante l'anno

    MODALITA' DI ACCERTAMENTO

    La validazione dei quiz sarà automatica per le domande online e dai docenti per domande aperte e laboratori.
    Tale validazione è mirata a valutare l'apprendimento da parte dello studente di concetti e strumenti descritti nel corso.

    Calendario appelli

    Data Ora Luogo Tipologia Note
    17/02/2021 09:00 GENOVA Esame su appuntamento
    29/07/2021 09:00 GENOVA Esame su appuntamento
    14/09/2021 09:00 GENOVA Esame su appuntamento
    28/01/2022 09:00 GENOVA Esame su appuntamento