Business Intelligence per i Big Data


This page has hierarchy - Parent page: Teaching

Table of content


Informazioni generali

Orario delle lezioni

GIORNO ORARIO AULA
Lunedì 11:30 – 14:30 Aula 11
Giovedì 11:30 – 14:30 LEP

Avvisi

  • Sono stati pubblicati i risultati della prova scritta del 03/07/2017
  • E’ stata pubblicata la lista di studenti che hanno consegnato le esercitazioni
  • E’ stato pubblicato l’esercitazione da consegnare sulla classificazione.
  • E’ stato pubblicato un esempio di processo RapidMiner per il preprocessing dei Tweet alla voce software di RapidMiner.
  • E’ stato pubblicato l’esercitazione da consegnare sulla tematica “MapReduce per Big Data”.
  • Sono state pubblicate le soluzioni degli esercizi MapReduce svolti in aula.
  • Sono stati pubblicati alcuni testi di esercizi d’esame di esempio

Esami

  • Appello del 03/07/2017
    • Risultati (pdf)

Lezioni

Data Warehouse

Data Mining

Big Data e NoSQL

Materiale di ripasso (Basi di dati)

Temi d’esame

Progetto di analisi di dati

  • Specifiche (pdf)
  • Script per il calcolo della misura SSE (download)
  • Calcolo Execution time di un operatore (download)

Esercitazioni

SQL esteso

Progettazione di data warehouse

Esercizi 

  • Esercizio: StraSport
  • Esercizio: Ditta elettrodomestici

 

Materiale di ripasso (Basi di dati)

 

Software

    • RapidMiner
      • Esempi di processi Rapid Miner (download)
      • Download page
      • Guida all’installazione
      • Suggerimenti: Dopo l’installazione base di RapidMiner, installare i seguenti plug-in (Menù Help->Update RapidMiner):
        • Parallel Processing Extension
        • Weka Extension
        • Wordnet Extension
        • Text Mining Extension
      • Script per il calcolo della misura SSE (download)
      • Processo RapidMiner per il preprocessing dei Tweet (zip) e slide di esempio (pdf)

Esercitazioni da consegnare  

In questa sezione sono riportate le indicazioni per la consegna delle esercitazioni da consegnare. La consegna nei tempi e modi previsti permetterà agli studenti un bonus all’esame (previa verifica del contenuto dell’elaborato sottomesso a cura del docente).

Svolgimento

L’esercitazione consiste nello svolgimento dei punti indicati nel testo di ogni esercitazione. L’attività si svolge individualmente e consiste nella redazione di un report contenente lo svolgimento dell’esercitazione. Il report va salvato in formato PDF. Il nome del file deve contenere nome, cognome, matricola dello studente e il numero dell’esercitazione secondo il seguente formato  Cognome_Nome_Matricola-EsN.PDF). Inoltre, la prima pagina del report deve contenere

  • nome del corso
  • data
  • titolo dell’elaborato
  • nome, cognome e matricola dello studente.

Il mancato rispetto delle suddette specifiche comporterà l’annullamento dell’elaborato. Non sarà possibile effettuate correzioni manuali dei nomi dei file dopo la consegna.

 Consegna

Caricare il file PDF sul portale della didattica, nella sezione di consegna elaborati del corso, entro la scadenza prevista per ogni esercitazione. Fa fede la data di caricamento indicata dal portale della didattica. Siccome i file caricati sono processati in modo automatico, il caricamento oltre la scadenza comporta l’annullamento della consegna della relativa esercitazione. Durante la procedura di upload viene richiesto l’inserimento di un campo “Descrizione”. Riportare lo stesso nome assegnato al file secondo le specifiche sopra descritte (con o senza estensione, nel campo descrizione è ininfluente).

Elenco degli studenti che hanno consegnato le esercitazioni (pdf)

Testi delle esercitazioni da consegnare

  • Esercitazione N1: MapReduce per Big Data: Testo esercitazione (pdf) . La soluzione: sarà pubblicata dopo la consegna. Per eventuali dubbi scrivere una mail a “daniele DOT apiletti AT polito DOT it”
    • La data di consegna dell’esercitazione N1 è il 15 Giugno 2017
  • Esercitazione N2: Classificazione: Testo esercitazione (pdf). Usare il seguente dataset (dataset_breast)
    • La data di consegna dell’esercitazione N2 è il 15 Giugno 2017

Esercitazioni in Laboratorio

# Esercitazione Data Orario Materiale
1 Sql base su Oracle XE 15-03-2017 11:30 – 14:30
  1. Testo esercitazione (pdf)
  2. Passi preliminari (OracleSQLdeveloperOracleXE)
  3. Script per la creazione della base di dati (OracleSQLdeveloper_DBscriptOracleApplicationExpress_DBscript)
  4. Soluzioni (pdf)
2 SQL Esteso 27/04/2017 11:30-14:30
  1.  Testo esercitazione (pdf)
  2. Soluzione del progetto concettuale di DW (pdf)
  3. Script per la creazione del data warehouse (OracleSQLDeveloperOracleXE)
    1. Screenshot per la connessione (OracleSQLDeveloper)
  4. Screenshot dei risultati (OracleSQLDeveloperOracleXE)
3 Pentaho 4/05/2017 11:30-14:30
  1. Testo esercitazione (pdf)
  2. Screenshot caricamento dimensioni (pdf)
  3. Caricamento data warehouse (zip, sql)
  4. Soluzione caricamento dimensioni (zip)
4 Rapid Miner 18/05/2017 13:00-14:30
  1. Introduzione a RapidMiner (2x6x)
  2. Guida di RapidMiner (download)
  3. Testo esercitazione (pdf)
  4. Datasets (zip)
5 Rapid Miner

Clustering

25/05/2017 13:00-14:30
  1. Testo esercitazione (pdf)
  2. Datasets (zip)
  3. Script per il calcolo della misura SSE (download)
6 Rapid Miner

Regole di Associazione – Classificazione

01/06/2017 11:30-14:30
  1. Testo esercitazione Regole Associazione (pdf)
  2. Testo esercitazione Classificazione (pdf)
  3. Datasets (zip)
  4. Bozza soluzione Classificazione (pdf)