Business Intelligence per Big Data

Business Intelligence per Big Data

Informazioni generali

SSD: ING-INF/05

CFU: 8

Docente: Tania Cerquitelli

Esercitatori: Eliana Pastor, Daniele Rege Cambrin

Avvisi

  • 27-02-23: inizio delle lezioni!
  • Siete invitati ad iscrivervi a Piazza per gestire al meglio le vostre domande e problematiche.
  • Per la prima esercitazione è necessario installare RapidMiner. Nella sezione Esercitazioni si trova una videoguida all’installazione.

Orari delle lezioni:

  • Lunedì ore 13:00-16:00, aula 4P
  • Giovedì ore 13:00-16:00, aula R3

Tutoraggio: Martedì ore 8:30-10:00, aula 4D


Slides delle lezioni

  • Introduzione all’insegnamento (slides)

Data science

Data Warehouse

  • Introduzione ai data warehouse (slides)
  • Progettazione di data warehouse (slides)
  • Analisi OLAP (slides)
  • Viste materializzate e Alimentazione (slides)
  • Data Lakes (pdf)
  • Data Warehouse in Oracle (pdf)

Big Data e NoSQL

Materiale di ripasso (Basi di dati)


Esercizi

Esercitazioni di Laboratorio

Le esercitazioni di laboratorio inizieranno a partire dalla terza settimana di lezione.

Video tutorial per l’installazione di RapidMiner Studio 9.10 ed estensioni su macOS e Windows 10. Le stesse procedure si applicano anche alle versioni successive.

Calendario (parziale) esercitazioni:


Esercitazioni da consegnare (homework)

In questa sezione saranno riportate le indicazioni per la consegna delle esercitazioni da consegnare (chiamate interscambiabilmente anche “homework” o “quaderni”). La consegna nei tempi e nei modi previsti permetterà agli studenti di ottenere un bonus all’esame (previa verifica del contenuto dell’elaborato sottomesso a cura del docente).

Svolgimento

L’esercitazione consiste nello svolgimento dei punti indicati nel testo di ogni esercitazione. L’attività deve essere svolta individualmente.

Consegna

Le informazioni riguardanti la consegna sono indicate all’interno del testo dell’esercitazione.

Per eseguire le query di MongoDB sul vostro cluster personale fare riferimento a questa guida (non consigliato).

Testo delle esercitazioni da consegnare

  • Esercitazione 1: testodati. L’esercitazione deve essere consegnata entro 15 giugno 2023 23:59:59 UTC+2.
  • Esercitazione 2: testo dati. L’esercitazione deve essere consegnata entro 15 giugno 2023 23:59:59 UTC+2.

Progetto di Analisi di Dati

Assegnazione Progetti (pdf)

Testi

Breve descrizione dei progetti (link) e presentazione (link).

  1. Clustering: testo, materiale
  2. Classificazione Binaria: testo, materiale
  3. Classificazione Multiclasse: testo, materiale

Consegna

Istruzioni dettagliate nella presentazione sopracitata.

Template latex (zip)

Si consiglia di utilizzare Overleaf per la gestione del report. Per importare il file zip: New Project -> Upload Project -> Selezionare lo zip