Informazioni generali
SSD: ING-INF/05
CFU: 8
Docente: Tania Cerquitelli
Esercitatori: Eliana Pastor, Daniele Rege Cambrin
Avvisi
- 27-02-23: inizio delle lezioni!
- Siete invitati ad iscrivervi a Piazza per gestire al meglio le vostre domande e problematiche.
- Per la prima esercitazione è necessario installare RapidMiner. Nella sezione Esercitazioni si trova una videoguida all’installazione.
Orari delle lezioni:
- Lunedì ore 13:00-16:00, aula 4P
- Giovedì ore 13:00-16:00, aula R3
Tutoraggio: Martedì ore 8:30-10:00, aula 4D
Slides delle lezioni
- Introduzione all’insegnamento (slides)
Data science
- Introduction to data science (slides)
- Data preprocessing (slides)
- Association rules (slides)
- Clustering (slides)
- Classification (slides)
- Regression Analysis (slides)
- Time series Analysis (slides)
Data Warehouse
- Introduzione ai data warehouse (slides)
- Progettazione di data warehouse (slides)
- Analisi OLAP (slides)
- Viste materializzate e Alimentazione (slides)
- Data Lakes (pdf)
- Data Warehouse in Oracle (pdf)
Big Data e NoSQL
Materiale di ripasso (Basi di dati)
- Modello relazionale (6 per pag. , 2 per pag.)
- Il linguaggio SQL: Istruzione SELECT – fondamenti (6 per pag. , 2 per pag.)
- Il linguaggio SQL: Istruzioni nidificate (6 per pag. , 2 per pag.)
- Il linguaggio SQL: istruzioni di aggiornamento (6 per pag. , 2 per pag.)
- Il linguaggio SQL: gestione delle tabelle (6 per pag. , 2 per pag.)
- Esercizi su SQL (testo, guida, materiale, soluzioni)
Esercizi
- Esercizio sulle viste materializzate (pdf, bozza soluzione)
- Esercizio: Ditta elettrodomestici (testo, bozza soluzione)
- Esercizio: Eccellenze Made In Italy (testo)
- Domande Teoria (testo, bozza soluzione)
- Domande Data Warehouse (testo)
Esercitazioni di Laboratorio
Le esercitazioni di laboratorio inizieranno a partire dalla terza settimana di lezione.
Video tutorial per l’installazione di RapidMiner Studio 9.10 ed estensioni su macOS e Windows 10. Le stesse procedure si applicano anche alle versioni successive.
Calendario (parziale) esercitazioni:
- Esercitazione #1 (16 marzo 2023): testo – materiale
- Esercitazione #2 (23 marzo 2023): testo – materiale
- Esercitazione #3 (30 marzo 2023): testo – materiale
- Esercitazione #4 (17 aprile 2023): testo – materiale
- Esercitazione #5 (22 maggio 2023): testo
- Esercitazione #6 (29 maggio 2023): testo
- Esercitazione #7 (5 giugno 2023): testo – materiale – soluzioni
Esercitazioni da consegnare (homework)
In questa sezione saranno riportate le indicazioni per la consegna delle esercitazioni da consegnare (chiamate interscambiabilmente anche “homework” o “quaderni”). La consegna nei tempi e nei modi previsti permetterà agli studenti di ottenere un bonus all’esame (previa verifica del contenuto dell’elaborato sottomesso a cura del docente).
Svolgimento
L’esercitazione consiste nello svolgimento dei punti indicati nel testo di ogni esercitazione. L’attività deve essere svolta individualmente.
Consegna
Le informazioni riguardanti la consegna sono indicate all’interno del testo dell’esercitazione.
Per eseguire le query di MongoDB sul vostro cluster personale fare riferimento a questa guida (non consigliato).
Testo delle esercitazioni da consegnare
- Esercitazione 1: testo – dati. L’esercitazione deve essere consegnata entro 15 giugno 2023 23:59:59 UTC+2.
- Esercitazione 2: testo – dati. L’esercitazione deve essere consegnata entro 15 giugno 2023 23:59:59 UTC+2.
Progetto di Analisi di Dati
Assegnazione Progetti (pdf)
Testi
Breve descrizione dei progetti (link) e presentazione (link).
- Clustering: testo, materiale
- Classificazione Binaria: testo, materiale
- Classificazione Multiclasse: testo, materiale
Consegna
Istruzioni dettagliate nella presentazione sopracitata.
Template latex (zip)
Si consiglia di utilizzare Overleaf per la gestione del report. Per importare il file zip: New Project -> Upload Project -> Selezionare lo zip