Business Intelligence per Big Data (2025/2026)

Business Intelligence per Big Data (2025/2026)

Informazioni generali

SSD: ING-INF/05

CFU: 8

Docente: Eliana Pastor

Esercitatori: Simone Monaco, Eleonora Poeta

Avvisi

  • 24-02-25: inizio delle lezioni
  • 17-03-25: Abbiamo riservato in orario di esercitazione il Laib 4, ad eccezione delle seguenti date in cui rimane confermata l’aula 21A:
    • 14 e 21 aprile
    • 5 e 19 maggio

Orari delle lezioni:

  • Martedì ore 11:30-13:00, aula 15A
  • Mercoledì ore 13:00-16:00, aula 15

Orari delle esercitazioni (dalla 3a settimana)

  • Martedì ore 14:30-16:00, aule LAIB4 – Squadra 1: A-MAR e Studenti e studentesse frequentanti il corso ‘Analisi tempo-frequenza e multiscala’
  • Martedì ore 16:00-17:30 aule LAIB4 – Squadra 2: MAS-Z e Studenti e studentesse frequentanti il corso GISP-ICT o altro corso in sovrapposizione

📚 Slides delle lezioni

Data science

Data Warehouse

  • Introduzione ai data warehouse (slides)
  • Progettazione di data warehouse (slides)
  • Analisi OLAP (slides)
  • Viste materializzate (slides)
  • Data Warehouse in Oracle (slides)

Big Data e NoSQL

Esercizi

  • Domande Teoria (slides)
  • Esercizio sulle viste materializzate (pdf)

Materiale di ripasso (Basi di dati)


💡 Esercitazioni di Laboratorio

Le esercitazioni di laboratorio inizieranno a partire dalla terza settimana di lezione.

Guida per l’installazione di Altair AI Studio/Rapidminer (il tutorial è su MacOS, la procedura è analoga su Windows): link

Guida Rapida per la risoluzione Errore HTML5 in RapidMiner: link

Guida all’uso di Colab: link

Notebooks per svolgere i laboratori in Python disponibili nella seguente GitHub repository.

Calendario (parziale) esercitazioni:


📝 Homework

In questa sezione sono pubblicati i testi e le indicazioni per gli Homework, ovvero le esercitazioni da svolgere autonomamente e da consegnare tramite caricamento sulla pagina del corso del portale della didattica (nella scheda “Consegna Elaborati”).

La consegna nei tempi e nei modi previsti e il superamento di un’eventuale verifica consentono agli studenti di ottenere punti aggiuntivi all’esame, secondo le modalità descritte nelle regole d’esame. Per chiedere eventuali informazioni sul quaderno, inviare un messaggio di posta elettronica secondo le seguenti modalità:

  • Il messaggio deve avere come oggetto “BIxBD quaderno“.
  • Nel corpo del messaggio devono essere indicati il proprio nomecognome e numero di matricola, oltre alla richiesta specifica.

Affinché la consegna del quaderno sia presa in considerazione per ottenere il relativo punteggio, è necessario rispettare le seguenti condizioni:

  • Svolgere tutti i punti indicati nel testo degli esercizi.
  • Preparare un file in formato PDF con lo svolgimento degli esercizi.

È obbligatorio assegnare il nome del file secondo il seguente formato (non è case sensitive): QuadernoN_Cognome_Nome_Matricola.XXX dove:

Matricola, Cognome e Nome vanno sostituiti con i dati dello studente; eventuali lettere accentate vanno riportate senza accenti; i nomi o i cognomi doppi (costituiti da più parole separate) vanno riportati come una parola unica senza spazi; la N che segue Quaderno va sostituita con il numero del quaderno consegnato; l’estensione del file XXX rispecchia il tipo di file prescelto per lo svolgimento degli esercizi (PDF).

Esempio: lo studente Marco Giulio De Medici, matricola S123456, consegna il quaderno numero 2 in formato PDF, il nome del file è Quaderno2_DeMedici_MarcoGiulio_s123456.pdf

Poiché i file caricati vengono elaborati automaticamente, l’assegnazione di un nome errato al file comporta l’annullamento della consegna del relativo quaderno. Non possono essere apportate correzioni manuali ai nomi dei file dopo la consegna.

Caricare il file sul portale della didattica, nella scheda “Consegna Elaborati”, entro la data di scadenza indicata per ciascun quaderno.

Non sono permessi caricamenti multipli per lo stesso studente e quaderno.

Fa fede la data di caricamento indicata sul portale della didattica.

Testo delle esercitazioni da consegnare

Esercitazione 1: testo – dati. L’esercitazione deve essere consegnata entro il 3 giugno 2026 23:59:59.


💻 Progetto di Analisi dei Dati

Per scegliere il progetto compilate il seguente form entro il 30 Aprile 2026 23:59:59 UTC+2.

Assegnazione Gruppi (pdf)

Esempio di report (link). NOTA: lo scopo è fornire un esempio di come può essere realizzato un report per il corso. Non costituisce un esempio di report per ottenere la massima votazione.

Presentazione dei progetti (link)

  1. Use Case Classificazione dell’abbandono aziendale (attrition): testo, materiale
  2. Use Case Classificazione della qualità del vino: testo, materiale

NOTA: i file di train possono essere modificati e usati come si ritiene opportuno. I file di test sono da utilizzare per valutare i modelli e non è possibile rimuovere o aggiungere campioni.

📦 Istruzioni per la consegna

Le istruzioni dettagliate si trovano nella Presentazione dei progetti.

Template latex da utilizzare (zip)

Si consiglia di utilizzare Overleaf per la gestione del report. Per importare il file zip: New Project -> Upload Project -> Selezionare lo zip

È obbligatorio utilizzare come nome del file per la consegna il seguente formato (non è case sensitive): Progetto_Matricola.zip
dove Matricola è la matricola del/della responsabile del progetto, Progetto può assumere valore Multiclasse o Binario in base al progetto assegnato.


Vuoi partecipare a uno studio sull’uso dell’AI generativa per la data analysis e sulla facilità di utilizzo dei notebook?

Info di accesso alle piattaforme:
– Colab: [link]

https://notebookgrader.com/invite/213e9c596a9b0f34fc49234d6874aa8206a7961c

https://dbdmg.polito.it/dbdmg_web/wp-content/uploads/2026/05/Study-1-Colab-Airbnb-Reviews-Data-Analysis.pdf
– Plainbook: [link]

https://dbdmg.polito.it/dbdmg_web/wp-content/uploads/2026/05/Study-1-Plainbook-Airbnb-Reviews-Data-Analysis.pdf