Business Intelligence per i Big Data
Table of content
- Informazioni generali
- Orario delle lezioni
- Avvisi
- Esami
- Lezioni
- Temi d’esame
- Progetto di analisi di dati
- Esercitazioni
- Esercitazioni da consegnare
- Esercitazioni in Laboratorio
Informazioni generali
- CFU: 8
- Docente: Tania Cerquitelli
- Esercitatori: Evelina Di Corso
Orario delle lezioni
GIORNO | ORARIO | AULA |
Lunedì | 11:30 – 14:30 | Aula 11 |
Giovedì | 11:30 – 14:30 | LEP |
Avvisi
- Sono stati pubblicati i risultati dell’esame scritto del 12 Luglio 2018. I compiti potranno essere visionati oggi lunedì 23/7 alle ore 13:30 presso l’aula 11B.
- Sono stati pubblicati i risultati dell’esame scritto del 25 Giugno 2018. I compiti potranno essere visionati il 9/7 alle ore 13:15 presso l’ufficio del docente sito presso la Cittadella Politecnica, ingresso da Corso Castelfidardo 38, IV piano, DAUIN.
- Sono stati pubblicati i risultati della prova in itinere del 3 Maggio 2018. I compiti potranno essere visionati il 21/6 alle ore 9:00 in aula da definire
- Giovedì 22 marzo 2018 si svolgerà la prima esercitazione di laboratorio presso il LEP.
- Sono state pubblicate le soluzioni degli esercizi della prima esercitazione.
- Giovedì 19 aprile 2018 si svolgerà la seconda esercitazione di laboratorio presso il LEP.
- Sono state pubblicate le soluzioni degli esercizi della seconda esercitazione (SQL Esteso).
- Giovedì 10 maggio 2018 si svolgerà la terza esercitazione di laboratorio presso il LEP.
- Giovedì 17 maggio 2018 si svolgerà la quarta esercitazione di laboratorio presso il LEP.
- Giovedì 24 maggio 2018 si svolgerà la quinta esercitazione di laboratorio presso il LEP.
- Giovedì 31 maggio 2018 si svolgerà la sesta esercitazione di laboratorio presso il LEP.
- E’ stato pubblicato il testo della prima esercitazione da consegnare.
- Giovedì 14 giugno 2018 si svolgerà la settima esercitazione di laboratorio presso il LEP.
- E’ stato pubblicato il testo della seconda esercitazione da consegnare.
Esami
- Appello del 12 Luglio 2018
- Risultati(pdf)
- Appello del 25 Giugno 2018
- Risultati(pdf)
- Prova in itinere 3 Maggio 2018
- Risultati (pdf)
Lezioni
- Introduzione al corso (2 per pag., 6 per pag.)
Data Warehouse
- Introduzione ai data warehouse (6 per pag., 2 per pag.)
- Progettazione di data warehouse (6 per pag., 2 per pag.)
- Analisi OLAP (6 per pag., 2 per pag.)
Data Mining
- Introduzione (6 slides per page, 2 slides per page)
- Data mining: introduzione (6 slides per page,2 slides per pag.)
- Data mining: Data (6 slides per page,2 slides per page)
- Regole di associazione (6 slides per page,2 slides per page)
- Classification I (6 slides per page, 2 slides per page) – versione ridotta (6 slides per page,2 slides per page)
- Classification II (2 slides per page, 6 slides per page)
- Clustering (2 slides per page, 6 slides per page)
- K-means parameter setting and Silhouette (pdf)
Big Data e NoSQL
- Beyond Relational Databases (2 per pag., 6 per pag.)
Materiale di ripasso (Basi di dati)
-
- Modello relazionale (6 per pag., 2 per pag.)
- Il linguaggio SQL: Istruzione SELECT – fondamenti (6 per pag., 2 per pag.)
- Il linguaggio SQL: Istruzioni nidificate (6 per pag.,2 per pag.)
- Il linguaggio SQL: istruzioni di aggiornamento (6 per pag.,2 per pag.)
- Il linguaggio SQL: gestione delle tabelle (6 per pag.,2 per pag.)
Temi d’esame
Progetto di analisi di dati
- Specifiche (pdf)
Esercitazioni
SQL esteso
Progettazione di data warehouse
Esercizi
- Esercizio: Annunci di affitti
- Esercizio: Ditta trasporti
- Esercizio: Alberghi
- Esercizio: Autogrill
- Esercizio: Network televisivo
- Esercizio: Societa’ di treni
- Esercizio: Turismo
- Esercizio: Societa’ SkiPass
- Esercizio: Ditta di spedizioni internazionali
- Esercizio: Telepass
- Esercizio: Poste Italiane
Materiale di ripasso (Basi di dati)
-
- Il linguaggio SQL: Istruzione SELECT – fondamenti
- Il linguaggio SQL: Istruzioni nidificate
Software
- Per gli interessati, è possibile installare il DBMS Oracle sul proprio PC personale. La versione gratuita da scaricare è Oracle Database 11g Express Edition.
- E’ disponibile anche un ambiente di sviluppo per poter interagire in modo più efficace con il DBMS, denominata Oracle SQL Developer. Per lo svolgimento delle esercitazioni di laboratorio l’uso di SQL developer è opzionale.
- Installazione del DBMS Oracle 11g Express Edition – Scaricare Oracle Database 11g Express Edition all’indirizzo http://www.oracle.com/technetwork/database/express-edition/overview/index.html. La relativa documentazione è reperibile all’indirizzo http://download.oracle.com/docs/cd/E17781_01/index.htm.
- Installazione dell’ambiente di sviluppo SQL Developer – SQL Developer è scaricabile all’indirizzo http://www.oracle.com/technetwork/developer-tools/sql-developer/overview/index.html
- Tutorial sulla procedura di download e installazione del DBMS Oracle 11g Express Edition e di SQL Developer
- Tutorial installazione DBMS Oracle 11g Express Edition e SQL Developer (pdf)
Documentazione
- Oracle Database Express Edition 11g documentation home page
- Oracle Database 11g documentation library
Installazione
- Oracle XE – documentazione e download (link)
- Guida all’installazione su Windows
- Guida all’installazione su Linux
Note importanti
- Per utilizzare Oracle XE sul proprio PC personale: la password dell’utente system è quella specificata durante la fase di installazione del software.
- Per poter svolgere delle esercitazioni è possibile installare ed utilizzare la versione a 32 bit anche su sistemi a 64 bit
- Per poter effettuare download del software è necessario accettare il License Agreement e creare (se non se ne possiede già uno) un account Oracle utilizzando come nome utente l’indirizzo email da studenti del Politecnico di Torino
Piattaforma di data mining e predictive analytics:
- RapidMiner
- Esempi di processi Rapid Miner (download)
- RapidMiner 8 (Download_link) – bisogna creare un account sul sito durante il download
- RapidMiner 5 (Download_link) – versione utilizzata in laboratorio
- Guida all’installazione
- Suggerimenti: Dopo l’installazione base di RapidMiner 5, installare i seguenti plug-in (Menù Help->Updates and Extensions (Marketplace) RapidMiner):
- Parallel Processing Extension
- Weka Extension
- Wordnet Extension
- Text Mining Extension
- Suggerimenti: Dopo l’installazione base di RapidMiner 8, installare i seguenti plug-in (Menù Extensions-> Marketplace (Updates and Extensions)):
- Text Processing
- Weka Extension
Esercitazioni da consegnare
In questa sezione sono riportate le indicazioni per la consegna delle esercitazioni da consegnare. La consegna nei tempi e modi previsti permetterà agli studenti un bonus all’esame (previa verifica del contenuto dell’elaborato sottomesso a cura del docente).
Svolgimento
L’esercitazione consiste nello svolgimento dei punti indicati nel testo di ogni esercitazione. L’attività si svolge individualmente e consiste nella redazione di un report contenente lo svolgimento dell’esercitazione. Il report va salvato in formato PDF. Il nome del file deve contenere nome, cognome, matricola dello studente e il numero dell’esercitazione secondo il seguente formato Cognome_Nome_Matricola-EsN.PDF). Inoltre, la prima pagina del report deve contenere
- nome del corso
- data
- titolo dell’elaborato
- nome, cognome e matricola dello studente.
Il mancato rispetto delle suddette specifiche comporterà l’annullamento dell’elaborato. Non sarà possibile effettuate correzioni manuali dei nomi dei file dopo la consegna.
Consegna
Caricare il file PDF sul portale della didattica, nella sezione di consegna elaborati del corso, entro la scadenza prevista per ogni esercitazione. Fa fede la data di caricamento indicata dal portale della didattica. Siccome i file caricati sono processati in modo automatico, il caricamento oltre la scadenza comporta l’annullamento della consegna della relativa esercitazione. Durante la procedura di upload viene richiesto l’inserimento di un campo “Descrizione”. Riportare lo stesso nome assegnato al file secondo le specifiche sopra descritte (con o senza estensione, nel campo descrizione è ininfluente).
Testi delle esercitazioni da consegnare
Esercitazione N1, MapReduce per Big Data: Testo esercitazione (pdf). La soluzione: sarà pubblicata dopo la consegna. Per eventuali dubbi scrivere via email a Daniele Apiletti (indirizzo: nome.cognome@polito.it). La scadenza della consegna dell’esercitazione è il 24 Giugno 2018.
Esercitazione N2: Classificazione: Testo esercitazione (pdf). Usare il seguente dataset (dataset_breast). La data di consegna dell’esercitazione N2 è il 24 Giugno 2018.
Esercitazioni in Laboratorio
# | Esercitazione | Data | Orario | Materiale |
1 | Sql base su Oracle XE e SQL Developer | 22-03-2018 | 11:30 – 14:30 |
|
2 | SQL Esteso | 19-04-2018 | 11:30 – 14:30 |
|
3 | Pentaho | 10-05-2018 | 11:30 – 14:30 | |
4 | RapidMiner
Pre-processing |
17-05-2018 | 11:30-14:30 | |
5 | Regole di associazione | 24-05-2018 | 11:30-14:30 | |
6 | Clustering | 31-05-2018 | 11:30-14:30 | |
7 | Classificazione | 14-06-2018 | 11:30-14:30 |