Data Science E Tecnologie Per Le Basi Di Dati (2024/2025)

Data Science E Tecnologie Per Le Basi Di Dati (2024/2025)

Informazioni generali

SSD: ING-INF/05

CFU: 8

Docenti: Elena Baralis, Tania Cerquitelli

Esercitatori: Daniele Apiletti, Alkis Koudounas, Davide Napolitano, Daniele Rege Cambrin

Avvisi

  • 24-09-2024: Inizio Lezioni

Slides delle lezioni

  • Introduzione al corso (slides)

Parte I

  • Data Science: introduzione (slides)
  • Data warehouse: introduzione (slides)
  • Data warehouse: progettazione concettuale e logica (slides)
  • Data warehouse: analisi (slides)
  • Data warehouse: progettazione fisica e alimentazione (slides)
  • Data lakes (slides)
  • Data mining process (slides)
  • Data preparation (slides)
  • Data mining: association rules (slides)
  • Data mining: classificazione (slides)
  • Data mining: clustering (slides)

Parte II

  • Introduzione al DBMS (slides)
  • Buffer Manager (slides)
  • Accesso fisico ai dati (slides)
  • Ottimizzatore delle query (slides)
  • Physical Design (slides)
  • Gestione della concorrenza (slides)
  • Gestione dell’affidabilità (slides)
  • DBMS distribuiti (slides)
  • NoSQL, beyond relational databases (slides)
  • Introduzione a MongoDB (slides)
  • ElasticSearch (slides)

Oracle


Slides delle esercitazioni

In questa sezione saranno pubblicati i testi delle esercitazioni, tra cui quelle svolte in aula, e temi d’esame.

SQL esteso

  • SQL esteso e viste materializzate in Oracle (slides)
  • Esercizio 1 (testo)
  • Viste materializzate e trigger (testo)
    • Materiale di supporto sui trigger (slides)

Data warehouse

  • Esercizio: Ditta elettrodomestici (testo)
  • Esercizio: Eccellenze Made in Italy (testo)
  • Esercizio: Teleriscaldamento (testo)
  • Esercizio: Pubblicazioni scientifiche (testo)

Ottimizzatore

  • Esercizio 1: Multe (testo)
  • Esercizio 2: Studenti (testo)
  • Esercizio 3: Atleti (testo)
  • Esercizio 4: Villaggio turistico (testo)

Esercitazioni di Laboratorio

Le esercitazioni di laboratorio inizieranno a partire dalla quarta settimana.

Ricordarsi di portare il proprio pc per svolgere il laboratorio.

Le esercitazioni di laboratorio avverranno per squadre, secondo la seguente suddivisione di cognome (le ripartizioni non sono definitive):

  • [Corso Baralis] AAA – CZZ: Team 1
  • [Corso Baralis] DAA – GRA: Team 2
  • [Corso Cerquitelli] GRB – PEZ: Team 3
  • [Corso Cerquitelli] PFA – ZZZ: Team 4

In caso di sovrapposizione compilare il seguente form.

I laboratori si svolgeranno durante le seguenti settimane (le date non sono al momento definitive — eventuali variazioni verranno comunicate con preavviso).

Le esercitazioni avverranno in:

  • LAIB2B, mercoledì 08:30-10:00 per il Team 1
  • 5T, venerdì 11:30-13:00 per il Team 2
  • LAIB1T, venerdì 11:30-13:00 per il Team 3
  • LAIB1T, venerdì 13:00-14:30 per il Team4

Calendario provvisorio

  • Settimana 14 Ottobre: Lab 1 (SQL esteso in Oracle)
  • Settimana 21 Ottobre: Lab 2
  • Settimana 6 Novembre: Lab 3

Lab 1 – Data Warehouse e SQL Esteso

  • Testo (pdf)
    • Data warehouse in formato csv (zip) e sql (zip)
    • Se si vuole svolgere il laboratorio online usare Oracle Live SQL (guida)
      • Qui si trova una guida completa su come utilizzare Oracle Live SQL per questo laboratorio
    • Se si vuole svolgere il laboratorio a casa, seguire i seguenti tutorial di installazione per Oracle Database Express e Oracle SQL Developer:

Esercitazioni da consegnare (homework)

In questa sezione sono pubblicati i testi e le indicazioni per i “quaderni”, le esercitazioni da svolgere autonomamente durante il corso e da consegnare tramite caricamento sulla pagina del corso del portale della didattica (nella scheda “Consegna Elaborati”). La consegna nei tempi e modi previsti, e il superamento di un’eventuale verifica permettono agli studenti di ottenere punti aggiuntivi all’esame, in base alle modalità descritte nelle regole d’esame. Per chiedere informazioni sul quaderno, inviare un messaggio di posta elettronica agli esercitatori con le seguenti modalità.

  • Il messaggio deve avere come oggetto “DSTBD quaderno“.
  • Nel corpo del messaggio devono essere indicati il proprio nomecognome e numero di matricola, oltre alla richiesta specifica.

Affinché la consegna del quaderno sia presa in considerazione per ottenere il relativo punteggio, è necessario rispettare le seguenti condizioni:

  • Svolgere tutti i punti indicati nel testo degli esercizi.
  • Preparare un file in formato PDF contenente lo svolgimento degli esercizi.
  • Assegnare il nome del file secondo il seguente formato (non è case sensitive): QuadernoN_Cognome_Nome_Matricola.XXX dove:
    • Matricola, Cognome e Nome sono da sostituire con i dati dello studente, eventuali lettere accentate sono da riportare senza accento, e nomi  o cognomi doppi (costituiti da più parole separate) devono essere riportati come una parola unica senza spazi;
    • la N che segue Quaderno deve essere sostituita con il numero di quaderno consegnato;
    • l’estensione del file XXX rispecchia il tipo di file prescelto per lo svolgimento degli esercizi (PDF).
    • Esempio: lo studente Marco Giulio De Medici, matricola S123456, consegna il quaderno numero 2 in formato PDF, il nome del file è Quaderno2_DeMedici_MarcoGiulio_s123456.PDF
    • Siccome i file caricati sono processati in modo automatico, l’assegnazione di un nome sbagliato al file comporta l’annullamento della consegna del relativo quaderno. Non saranno effettuate correzioni manuali dei nomi dei file dopo la consegna.
  • Caricare il file sul portale della didattica, nella scheda “Consegna Elaborati”, entro la data di scadenza indicata per ciascun quaderno.
    • Non sono permessi caricamenti multipli per lo stesso studente e quaderno.
    • Fa fede la data di caricamento indicata dal portale della didattica.
    • Siccome i file caricati sono processati in modo automatico, il caricamento oltre la scadenza comporta l’annullamento della consegna del relativo quaderno.
    • Durante la procedura di upload viene richiesto l’inserimento di un campo “Descrizione”. Riportare lo stesso nome assegnato al file secondo le specifiche sopra descritte (con o senza estensione, nel campo descrizione è ininfluente).
    • Solo coloro che non hanno accesso alla pagina web del corso sul portale della didattica possono consegnare le esercitazioni tramite mail agli esercitatori entro la data di consegna.
  • Sostenere con esito positivo il colloquio di verifica nella data prevista (si vedano le regole d’esame).

Testo delle esercitazioni da consegnare (quaderni)

Quaderni consegnati per l’A.A. 2024/25