Informazioni generali
SSD: ING-INF/05
CFU: 8
Docente: Eliana Pastor
Esercitatori: Simone Monaco, Eleonora Poeta
Avvisi
- 24-02-25: inizio delle lezioni
- 17-03-25: Abbiamo riservato in orario di esercitazione il Laib 4, ad eccezione delle seguenti date in cui rimane confermata l’aula 21A:
- 14 e 21 aprile
- 5 e 19 maggio
Orari delle lezioni:
- Martedì ore 11:30-13:00, aula 15A
- Mercoledì ore 13:00-16:00, aula 15
Orari delle esercitazioni (dalla 3a settimana)
- Martedì ore 14:30-16:00, aule LAIB4 – Squadra 1: A-MAR e Studenti e studentesse frequentanti il corso ‘Analisi tempo-frequenza e multiscala’
- Martedì ore 16:00-17:30 aule LAIB4 – Squadra 2: MAS-Z e Studenti e studentesse frequentanti il corso GISP-ICT o altro corso in sovrapposizione
📚 Slides delle lezioni
Data science
- Introduzione all’insegnamento (slides)
- Introduction to data science (slides)
- Data preprocessing (slides)
- Data preprocessing – Document data (slides)
- Regole di associazione (slides, slides)
- Clustering (slides)
- Classificazione (slides)
- Regressione (slides)
- Time series (slides)
Data Warehouse
- Introduzione ai data warehouse (slides)
- Progettazione di data warehouse (slides)
- Analisi OLAP (slides)
- Viste materializzate (slides)
- Data Warehouse in Oracle (slides)
Big Data e NoSQL
Esercizi
Materiale di ripasso (Basi di dati)
- Il linguaggio SQL: istruzioni di aggiornamento (6 per pag. , 2 per pag.)
- Recap fondamenti (slides)
- Il linguaggio SQL: gestione delle tabelle (6 per pag. , 2 per pag.)
- Modello relazionale (6 per pag. , 2 per pag.)
- Il linguaggio SQL: Istruzione SELECT – fondamenti (6 per pag. , 2 per pag.)
- Il linguaggio SQL: Istruzioni nidificate (6 per pag. , 2 per pag.)
💡 Esercitazioni di Laboratorio
Le esercitazioni di laboratorio inizieranno a partire dalla terza settimana di lezione.
Guida per l’installazione di Altair AI Studio/Rapidminer (il tutorial è su MacOS, la procedura è analoga su Windows): link
Guida Rapida per la risoluzione Errore HTML5 in RapidMiner: link
Guida all’uso di Colab: link
Notebooks per svolgere i laboratori in Python disponibili nella seguente GitHub repository.
Calendario (parziale) esercitazioni:
- Esercitazione #1 (10 marzo 2026): slides – testo – materiale – python_notebook – soluzione_python
- Esercitazione #2 (17 marzo 2026): slides – testo – materiale
- Esercitazione #3 (24 marzo 2026): slides* – testo – materiale – python_notebook – soluzione_python — (*slides aggiornate in data 31 Marzo 2026)
- Esercitazione #4 (31 marzo 2026): slides – testo – materiale – python_notebook – soluzione_python
- Esercitazione #5 (14 aprile 2026): slides – testo – materiale – python_notebook – soluzione_python
- Esercitazione #6 (21 aprile 2026): slides – testo – materiale – python_notebook
- Esercitazione #7 (28 aprile 2026): testo – notebook – soluzione
- Esercitazione #8 (5 maggio 2026): testo
- Esercitazione #9 (12 maggio 2026): testo
📝 Homework
In questa sezione sono pubblicati i testi e le indicazioni per gli Homework, ovvero le esercitazioni da svolgere autonomamente e da consegnare tramite caricamento sulla pagina del corso del portale della didattica (nella scheda “Consegna Elaborati”).
La consegna nei tempi e nei modi previsti e il superamento di un’eventuale verifica consentono agli studenti di ottenere punti aggiuntivi all’esame, secondo le modalità descritte nelle regole d’esame. Per chiedere eventuali informazioni sul quaderno, inviare un messaggio di posta elettronica secondo le seguenti modalità:
- Il messaggio deve avere come oggetto “BIxBD quaderno“.
- Nel corpo del messaggio devono essere indicati il proprio nome, cognome e numero di matricola, oltre alla richiesta specifica.
Affinché la consegna del quaderno sia presa in considerazione per ottenere il relativo punteggio, è necessario rispettare le seguenti condizioni:
- Svolgere tutti i punti indicati nel testo degli esercizi.
- Preparare un file in formato PDF con lo svolgimento degli esercizi.
È obbligatorio assegnare il nome del file secondo il seguente formato (non è case sensitive): QuadernoN_Cognome_Nome_Matricola.XXX dove:
Matricola, Cognome e Nome vanno sostituiti con i dati dello studente; eventuali lettere accentate vanno riportate senza accenti; i nomi o i cognomi doppi (costituiti da più parole separate) vanno riportati come una parola unica senza spazi; la N che segue Quaderno va sostituita con il numero del quaderno consegnato; l’estensione del file XXX rispecchia il tipo di file prescelto per lo svolgimento degli esercizi (PDF).
Esempio: lo studente Marco Giulio De Medici, matricola S123456, consegna il quaderno numero 2 in formato PDF, il nome del file è Quaderno2_DeMedici_MarcoGiulio_s123456.pdf
Poiché i file caricati vengono elaborati automaticamente, l’assegnazione di un nome errato al file comporta l’annullamento della consegna del relativo quaderno. Non possono essere apportate correzioni manuali ai nomi dei file dopo la consegna.
Caricare il file sul portale della didattica, nella scheda “Consegna Elaborati”, entro la data di scadenza indicata per ciascun quaderno.
Non sono permessi caricamenti multipli per lo stesso studente e quaderno.
Fa fede la data di caricamento indicata sul portale della didattica.
Testo delle esercitazioni da consegnare
Esercitazione 1: testo – dati. L’esercitazione deve essere consegnata entro il 3 giugno 2026 23:59:59.
💻 Progetto di Analisi dei Dati
Per scegliere il progetto compilate il seguente form entro il 30 Aprile 2026 23:59:59 UTC+2.
Assegnazione Gruppi (pdf)
Esempio di report (link). NOTA: lo scopo è fornire un esempio di come può essere realizzato un report per il corso. Non costituisce un esempio di report per ottenere la massima votazione.
Presentazione dei progetti (link)
- Use Case Classificazione dell’abbandono aziendale (attrition): testo, materiale
- Use Case Classificazione della qualità del vino: testo, materiale
NOTA: i file di train possono essere modificati e usati come si ritiene opportuno. I file di test sono da utilizzare per valutare i modelli e non è possibile rimuovere o aggiungere campioni.
📦 Istruzioni per la consegna
Le istruzioni dettagliate si trovano nella Presentazione dei progetti.
Template latex da utilizzare (zip)
Si consiglia di utilizzare Overleaf per la gestione del report. Per importare il file zip: New Project -> Upload Project -> Selezionare lo zip
È obbligatorio utilizzare come nome del file per la consegna il seguente formato (non è case sensitive): Progetto_Matricola.zip
dove Matricola è la matricola del/della responsabile del progetto, Progetto può assumere valore Multiclasse o Binario in base al progetto assegnato.
Vuoi partecipare a uno studio sull’uso dell’AI generativa per la data analysis e sulla facilità di utilizzo dei notebook?
Info di accesso alle piattaforme:
– Colab: [link]
https://notebookgrader.com/invite/213e9c596a9b0f34fc49234d6874aa8206a7961c
https://dbdmg.polito.it/dbdmg_web/wp-content/uploads/2026/05/Study-1-Colab-Airbnb-Reviews-Data-Analysis.pdf
– Plainbook: [link]
