CODICE 101747 ANNO ACCADEMICO 2020/2021 CFU 6 cfu anno 3 INFORMATICA 8759 (L-31) - GENOVA SETTORE SCIENTIFICO DISCIPLINARE INF/01 LINGUA Italiano SEDE GENOVA PERIODO 2° Semestre MATERIALE DIDATTICO AULAWEB PRESENTAZIONE Il corso consiste in una serie di attività collegate tra loro mirate ad introdurre temi generali legati all’area della Data Science e Data Engineering In particolare vedremo una panoramica legata alla costruzione di sistemi ed applicazioni informatiche per la raccolta, gestione, analisi e visualizzazione di dati. Ogni attività sarà costituita da alcune lezioni, seminari informativi e attività laboratoriale OBIETTIVI E CONTENUTI OBIETTIVI FORMATIVI Introduzione a strumenti utile nell'area della Data Science come Python e librerie collegate (itertools, numpy, scipy, ecc) ed esempi di applicazioni dell'informatica e della statistica all'analisi di dati OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO Il corso ha un molteplici obiettivo - introdurre all'uso di strumenti molto usati nell'ambito della Data Science come il linguaggio Python, Jupyter Notebook, Google Colab, librerie di analisi e visualizzazione di dati e grafi; - introdurre alcuni concetti e metodi comunemente usati per l'analisi di dati (PCA, clustering, time series, ecc) - mostrare esempi e ambiti applicativi della data science attraverso seminari e laboratori I risultati di apprendimento vengono valutati in base ad attività di laboratorio e presentazioni da parte degli studenti PREREQUISITI Programmazione Matematica e statistica di base MODALITA' DIDATTICHE Lezioni frontali Briefing su esercitazioni di laboratorio e soluzioni proposte dagli studenti Consegna di 5 esercitazioni proposte durante il corso e di un esercizio finale riepilogativo PROGRAMMA/CONTENUTO Introduzione a Python Costrutti Immagini e matrici Dizionari Scoping e Classi Ereditarietà ed Eccezioni Pandas Iteratori/generatori, map, reduce Analisi di dati: - itertools - scipy - pca - regressione lineareNotebook Grafici e Regressione LineareURL - clustering (combinazione KNN e PCA) - time series Data visualization: - GeoPandas - Plotly Grafi con NetworkX Introduzione a sistemi distribuiti, HPC e Big Data Introduzione a Internet of Things/Edge Computing TESTI/BIBLIOGRAFIA Lucidi, lezioni registrate e note messe a dispozione dai docenti Introduzione alla Programmazione in Python - Apogeo Big Data Analysis - Apogeo DOCENTI E COMMISSIONI GIORGIO DELZANNO Ricevimento: Su appuntamento in presenza o Teams Commissione d'esame GIORGIO DELZANNO (Presidente) BARBARA CATANIA GIOVANNA GUERRINI NICOLETTA NOCETI LEZIONI INIZIO LEZIONI Febbraio 2021 Orari delle lezioni L'orario di questo insegnamento è consultabile all'indirizzo: Portale EasyAcademy ESAMI MODALITA' D'ESAME L'esame consiste in un quiz online e una presentazione (in presenza o remoto) dei laboratori consegnati durante l'anno MODALITA' DI ACCERTAMENTO La validazione dei quiz sarà automatica per le domande online e dai docenti per domande aperte e laboratori. Tale validazione è mirata a valutare l'apprendimento da parte dello studente di concetti e strumenti descritti nel corso. Calendario appelli Data appello Orario Luogo Tipologia Note 17/02/2021 09:00 GENOVA Esame su appuntamento 29/07/2021 09:00 GENOVA Esame su appuntamento 14/09/2021 09:00 GENOVA Esame su appuntamento 28/01/2022 09:00 GENOVA Esame su appuntamento