Business Intelligence per Big Data
Table of content
- Informazioni generali
- Orario delle lezioni
- Avvisi
- Esami
- Lezioni
- Progetto di Analisi di dati
- Esercitazioni in Laboratorio
- Esercitazioni da consegnare
- Temi d’esame
- Progetto di analisi di dati
- Altro materiale
- Esercitazioni in Laboratorio
Informazioni generali
- CFU: 8
- Docente: Tania Cerquitelli
- Esercitatore: Giuseppe Attanasio
Orario delle lezioni
GIORNO | ORARIO | AULA |
Martedì | 10:00 – 13:00 | Virtual Classroom |
Giovedì | 13:00 – 16:00 | Virtual Classroom |
Avvisi
- Durante il semestre useremo Piazza come piattaforma Q&A. Vi chiediamo di registrarvi qui, con la vostra email istituzionale (@studenti.polito.it) e il vostro nome e cognome.
Esami
Lezioni
Data science
- Introduction to data science (pdf)
- Data preprocessing (pdf)
- Data exploration (pdf)
- Association rules (pdf)
- Clustering (pdf)
- Classification (pdf)
- Use case: Modelling energy efficiency of buildings based on open-data (pdf)
- Use case: Predictive maintenance (pdf)
- Use case: Characterising Electricity Consumption Over Time (pdf)
Data Warehouse
- Introduzione ai data warehouse (2 per pag.)
- Progettazione di data warehouse [(6 per pag), (2 slide per pag.), (1 slide per pag.)]
- Analisi OLAP (6 per pag., 2 per pag. NEW: 1 per pag )
- SQL esteso e viste materializzate in Oracle (2 per pag, 6 per pag )
Big Data e NoSQL
Progetto di Analisi di dati
- Specifiche (pdf)
Progettazione di data warehouse
Esercizi
- Esercizio: StraSport
- Esercizio: Ditta elettrodomestici
- Esercizio: Annunci di affitti
- Esercizio: Ditta trasporti
- Esercizio: Alberghi
- Esercizio: Autogrill
- Esercizio: Turismo
- Esercizio: Societa’ SkiPass
- Esercizio: Ditta di spedizioni internazionali
- Esercizio: Telepass
- Esercizio: Poste Italiane
- Esempi specifici di progettazione di DW e query in SQL esteso (pdf)
- GiocoXTutti (Testo pdf)
- Made in Italy (Testo pdf)
- Teleriscaldamento (Testo pdf)
- Viste materializzate (pdf)
Materiale di ripasso (Basi di dati)
-
- Modello relazionale (6 per pag., 2 per pag.)
- Il linguaggio SQL: Istruzione SELECT – fondamenti (6 per pag., 2 per pag.)
- Il linguaggio SQL: Istruzioni nidificate (6 per pag.,2 per pag.)
- Il linguaggio SQL: istruzioni di aggiornamento (6 per pag.,2 per pag.)
- Il linguaggio SQL: gestione delle tabelle (6 per pag.,2 per pag.)
Esercitazioni in Laboratorio
Informazioni generali
- Video tutorial per l’installazione di RapidMiner Studio 9.6 ed estensioni su macOS Catalina e Windows 10.
- I laboratori verranno registrati. In prima istanza, verrà usata la piattaforma Virtual Classroom/Zoom. In caso di malfunzionamento, verrà specificato su questa pagina un link ad una piattaforma esterna su cui comunque sarà effettuata la registrazione.
Testi e materiale
- Esercitazione #1 (18 marzo 2021, 13:00-16:00): testo e materiale.
- Esercitazione #2 (23 marzo 2021, 10.00-13.00): testo e materiale
- Esercitazione #3 (8 aprile 2021, 13:00-16:00): testo e materiale
- Esercitazione #4 (15 aprile 2021, 13:00-16:00): testo e materiale
- Esercitazione #5 (18 maggio 2021, 10.00-13.00): testo e materiale
- Esercitazione #6 (27 maggio 2021, 14.30-16.00): testo e materiale, soluzioni alle query
- Esercitazione #7 (3 giugno 2021, 14.30-16.00): testo, soluzioni alle query
Materiale aggiuntivo per approfondire
- Maggiori dettagli sui due tipi principali in RapidMiner Studio.
- Definizione e calcolo dei quartili.
- DBSCAN: riassunto teorico e visualizzazione dell’algoritmo.
- Principal Component Analysis con SVD: quick start (Appendix del pdf), riassunto teorico, visualizzazione della moltiplicazione matriciale.
- L’operatore Execute Python.
Esercitazioni da consegnare
In questa sezione sono riportate le indicazioni per la consegna delle esercitazioni da consegnare (chiamate di seguito interscambiabilmente anche “homework” o “quaderni”). La consegna nei tempi e nei modi previsti permetterà agli studenti di ottenere un bonus all’esame (previa verifica del contenuto dell’elaborato sottomesso a cura del docente).
Svolgimento
L’esercitazione consiste nello svolgimento dei punti indicati nel testo di ogni esercitazione. L’attività deve essere svolta individualmente e consiste nella redazione di un report contenente lo svolgimento dell’esercitazione. La prima pagina del report deve contenere:
- nome del corso
- data
- titolo dell’elaborato
- nome, cognome e matricola dello studente.
Il mancato rispetto delle suddette specifiche comporterà l’annullamento dell’elaborato. Non sarà possibile effettuare correzioni manuali dei nomi dei file dopo la consegna.
Consegna
Il report va salvato in formato PDF. Per facilitare la raccolta e la correzione dei report, vi chiediamo di seguire queste indicazioni in fase di caricamento:
- Caricare il file da consegnare nella sezione Elaborati del Portale della Didattica (pagina del corso). Il file deve essere caricato entro la scadenza prevista per ogni esercitazione. Fa fede la data di caricamento indicata dal portale della didattica. Poichè i file caricati sono processati in modo automatico, il caricamento oltre la scadenza comporta l’annullamento della consegna della relativa esercitazione.
- Il nome del file deve avere il seguente formato: Cognome_Nome_Matricola_Es<NumeroEsercitazione>.<Estensione>. Ad esempio, Mario Rossi (s222222) caricherà il primo homework con il file nominato Rossi_Mario_s222222_Es1.pdf
- Durante la procedura di upload viene richiesto l’inserimento di un campo “Descrizione”: inserire lo stesso nome del file. Nell’esempio del punto precedente la descrizione sarebbe stata: Rossi_Mario_s222222_Es1.pdf
Testi delle esercitazioni da consegnare
Esercitazione 1, classificazione: testo e materiale. L’esercitazione deve essere consegnata entro e non oltre il: 13 maggio 2021 23:59:59 CEST.
Esercitazione 2, MongoDB: testo. L’esercitazione deve essere consegnata entro e non oltre il: 01 Luglio 2021 23:59:59 CEST.