Informazioni generali
SSD: ING-INF/05
CFU: 8
Docente: Eliana Pastor
Esercitatori: Simone Monaco, Eleonora Poeta
Avvisi
- 24-02-25: inizio delle lezioni
- 17-03-25: Abbiamo riservato in orario di esercitazione il Laib 4, ad eccezione delle seguenti date in cui rimane confermata l’aula 21A:
- 14 e 21 aprile
- 5 e 19 maggio
Orari delle lezioni:
- Martedì ore 11:30-13:00, aula 15A
- Mercoledì ore 13:00-16:00, aula 15
Orari delle esercitazioni (dalla 3a settimana)
- Martedì ore 14:30-16:00, aule LAIB4 – Squadra 1: A-MAR e Studenti e studentesse frequentanti il corso ‘Analisi tempo-frequenza e multiscala’
- Martedì ore 16:00-17:30 aule LAIB4 – Squadra 2: MAS-Z e Studenti e studentesse frequentanti il corso GISP-ICT o altro corso in sovrapposizione
📚 Slides delle lezioni
Data science
- Introduzione all’insegnamento (slides)
- Introduction to data science (slides)
- Data preprocessing (slides)
- Data preprocessing – Document data (slides)
- Regole di associazione (slides, slides)
- Clustering (slides)
- Classificazione (slides)
- Regressione (slides)
- Time series (slides)
Data Warehouse
Introduzione ai data warehouse (slides)
Progettazione di data warehouse (slides)
Esercizi
- Domande Teoria (slides)
💡 Esercitazioni di Laboratorio
Le esercitazioni di laboratorio inizieranno a partire dalla terza settimana di lezione.
Guida per l’installazione di Altair AI Studio/Rapidminer (il tutorial è su MacOS, la procedura è analoga su Windows): link
Guida Rapida per la risoluzione Errore HTML5 in RapidMiner: link
Guida all’uso di Colab: link
Notebooks per svolgere i laboratori in Python disponibili nella seguente GitHub repository.
Calendario (parziale) esercitazioni:
- Esercitazione #1 (10 marzo 2026): slides – testo – materiale – python_notebook – soluzione_python
- Esercitazione #2 (17 marzo 2026): slides – testo – materiale
- Esercitazione #3 (24 marzo 2026): slides* – testo – materiale – python_notebook – soluzione_python — (*slides aggiornate in data 31 Marzo 2026)
- Esercitazione #4 (31 marzo 2026): slides – testo – materiale – python_notebook – soluzione_python
- Esercitazione #5 (14 aprile 2026): slides – testo – materiale – python_notebook – soluzione_python
- Esercitazione #6 (21 aprile 2026): slides – testo – materiale – python_notebook
💻 Progetto di Analisi dei Dati
Per scegliere il progetto compilate il seguente form entro il 30 Aprile 2026 23:59:59 UTC+2.
Esempio di report (link). NOTA: lo scopo è fornire un esempio di come può essere realizzato un report per il corso. Non costituisce un esempio di report per ottenere la massima votazione.
Presentazione dei progetti (link)
- Use Case Classificazione dell’abbandono aziendale (attrition): testo, materiale
- Use Case Classificazione della qualità del vino: testo, materiale
NOTA: i file di train possono essere modificati e usati come si ritiene opportuno. I file di test sono da utilizzare per valutare i modelli e non è possibile rimuovere o aggiungere campioni.
📦 Istruzioni per la consegna
Le istruzioni dettagliate si trovano nella Presentazione dei progetti.
Template latex da utilizzare (zip)
Si consiglia di utilizzare Overleaf per la gestione del report. Per importare il file zip: New Project -> Upload Project -> Selezionare lo zip
È obbligatorio utilizzare come nome del file per la consegna il seguente formato (non è case sensitive): Progetto_Matricola.zip
dove Matricola è la matricola del/della responsabile del progetto, Progetto può assumere valore Multiclasse o Binario in base al progetto assegnato.
