Business Intelligence per i Big Data


This page has hierarchy - Parent page: Teaching

Table of content


Informazioni generali

Orario delle lezioni

GIORNO ORARIO AULA
Lunedì 11:30 – 14:30 Aula 11
Giovedì 11:30 – 14:30 LEP

Avvisi

  • Dataset (dataset_201520162017_Milano_daily_pollutants)
  • Sono stati pubblicati i risultati dell’esame scritto del 25 Giugno 2018. I compiti potranno essere visionati il 9/7 alle ore 13:15 presso l’ufficio del docente sito presso la Cittadella Politecnica, ingresso da Corso Castelfidardo 38, IV piano, DAUIN.
  • Sono stati pubblicati i risultati della prova in itinere del 3 Maggio 2018. I compiti potranno essere visionati il 21/6 alle ore 9:00 in aula da definire
  • Giovedì 22 marzo 2018 si svolgerà la prima esercitazione di laboratorio presso il LEP.
  • Sono state pubblicate le soluzioni degli esercizi della prima esercitazione.
  • Giovedì 19 aprile 2018 si svolgerà la seconda esercitazione di laboratorio presso il LEP.
  • Sono state pubblicate le soluzioni degli esercizi della seconda esercitazione (SQL Esteso).
  • Giovedì 10 maggio 2018 si svolgerà la terza esercitazione di laboratorio presso il LEP.
  • Giovedì 17 maggio 2018 si svolgerà la quarta esercitazione di laboratorio presso il LEP.
  • Giovedì 24 maggio 2018 si svolgerà la quinta esercitazione di laboratorio presso il LEP.
  • Giovedì 31 maggio 2018 si svolgerà la sesta esercitazione di laboratorio presso il LEP.
  • E’ stato pubblicato il testo della prima esercitazione da consegnare.
  • Giovedì 14 giugno 2018 si svolgerà la settima esercitazione di laboratorio presso il LEP.
  • E’ stato pubblicato il testo della seconda esercitazione da consegnare.

 

Esami

  • Appello del 25 Giugno 2018
    • Risultati(pdf)
  • Prova in itinere 3 Maggio 2018
    • Risultati (pdf)

Lezioni

Data Warehouse

Data Mining

Big Data e NoSQL

Materiale di ripasso (Basi di dati)

Temi d’esame

Progetto di analisi di dati

  • Specifiche (pdf)

Esercitazioni

 

SQL esteso

Progettazione di data warehouse

Esercizi 

  • Esercizio: StraSport
  • Esercizio: Ditta elettrodomestici

Materiale di ripasso (Basi di dati)

Software

Documentazione

Installazione

  • Oracle XE – documentazione e download (link)
  • Guida all’installazione su Windows
  • Guida all’installazione su Linux

Note importanti

  • Per utilizzare Oracle XE sul proprio PC personale: la password dell’utente system è quella specificata durante la fase di installazione del software.
  • Per poter svolgere delle esercitazioni è possibile installare ed utilizzare la versione a 32 bit anche su sistemi a 64 bit
  • Per poter effettuare download del software è necessario accettare il License Agreement e creare (se non se ne possiede già uno) un account Oracle utilizzando come nome utente l’indirizzo email da studenti del Politecnico di Torino

Piattaforma di data mining e predictive analytics:

  • RapidMiner
    • Esempi di processi Rapid Miner (download)
    • RapidMiner 8 (Download_link) – bisogna creare un account sul sito durante il download
    • RapidMiner 5 (Download_link) – versione utilizzata in laboratorio
    • Guida all’installazione
    • Suggerimenti: Dopo l’installazione base di RapidMiner 5, installare i seguenti plug-in (Menù Help->Updates and Extensions (Marketplace) RapidMiner):
      • Parallel Processing Extension
      • Weka Extension
      • Wordnet Extension
      • Text Mining Extension
    • Suggerimenti: Dopo l’installazione base di RapidMiner 8, installare i seguenti plug-in (Menù Extensions-> Marketplace (Updates and Extensions)):
      • Text Processing
      • Weka Extension
      

 

Esercitazioni da consegnare  

 

In questa sezione sono riportate le indicazioni per la consegna delle esercitazioni da consegnare. La consegna nei tempi e modi previsti permetterà agli studenti un bonus all’esame (previa verifica del contenuto dell’elaborato sottomesso a cura del docente).

Svolgimento

L’esercitazione consiste nello svolgimento dei punti indicati nel testo di ogni esercitazione. L’attività si svolge individualmente e consiste nella redazione di un report contenente lo svolgimento dell’esercitazione. Il report va salvato in formato PDF. Il nome del file deve contenere nome, cognome, matricola dello studente e il numero dell’esercitazione secondo il seguente formato  Cognome_Nome_Matricola-EsN.PDF). Inoltre, la prima pagina del report deve contenere

  • nome del corso
  • data
  • titolo dell’elaborato
  • nome, cognome e matricola dello studente.

Il mancato rispetto delle suddette specifiche comporterà l’annullamento dell’elaborato. Non sarà possibile effettuate correzioni manuali dei nomi dei file dopo la consegna.

Consegna

Caricare il file PDF sul portale della didattica, nella sezione di consegna elaborati del corso, entro la scadenza prevista per ogni esercitazione. Fa fede la data di caricamento indicata dal portale della didattica. Siccome i file caricati sono processati in modo automatico, il caricamento oltre la scadenza comporta l’annullamento della consegna della relativa esercitazione. Durante la procedura di upload viene richiesto l’inserimento di un campo “Descrizione”. Riportare lo stesso nome assegnato al file secondo le specifiche sopra descritte (con o senza estensione, nel campo descrizione è ininfluente).

 

Testi delle esercitazioni da consegnare

Esercitazione N1, MapReduce per Big Data: Testo esercitazione (pdf). La soluzione: sarà pubblicata dopo la consegna. Per eventuali dubbi scrivere via email a Daniele Apiletti (indirizzo: nome.cognome@polito.it). La scadenza della consegna dell’esercitazione è il 24 Giugno 2018.

Esercitazione N2: Classificazione: Testo esercitazione (pdf). Usare il seguente dataset (dataset_breast). La data di consegna dell’esercitazione N2 è il 24 Giugno 2018.

 

 

 

Esercitazioni in Laboratorio

# Esercitazione Data Orario Materiale
1 Sql base su Oracle XE e SQL Developer 22-03-2018 11:30 – 14:30
  1. Testo esercitazione (pdf)
  2. Passi preliminari (OracleSQLdeveloperOracleXE)
  3. Script per la creazione della base di dati (OracleSQLdeveloper_DBscriptOracleApplicationExpress_DBscript)
  4. Soluzioni (pdf)
2 SQL Esteso 19-04-2018 11:30 – 14:30
  1.  Testo esercitazione (pdf)
  2. Soluzione del progetto concettuale di DW (pdf)
  3. Script per la creazione del data warehouse (OracleSQLDeveloperOracleXE)
    1. Screenshot per la connessione (OracleSQLDeveloper)
  4. Screenshot dei risultati (OracleSQLDeveloperOracleXE)
  5. Soluzioni (pdf)
3 Pentaho 10-05-2018 11:30 – 14:30
  1. Testo esercitazione (pdf)
  2. Screenshot caricamento dimensioni (pdf)
  3. Caricamento data warehouse (zip, sql)
  4. Soluzione caricamento dimensioni (zip)
4 RapidMiner

Pre-processing

 17-05-2018 11:30-14:30
  1. Testo esercitazione (pdf)
  2. Dataset (zip)
5 Regole di associazione 24-05-2018 11:30-14:30
  1. Testo esercitazione (pdf)
  2. Dataset (zip)
6 Clustering 31-05-2018 11:30-14:30
  1. Testo esercitazione (pdf)
  2. Dataset (zip)
  3. Script per il calcolo della misura SSE (download)
7 Classificazione 14-06-2018 11:30-14:30
  1. Testo esercitazione (pdf)
  2. Dataset (zip)
  3. Soluzione (pdf)