Ecole Polytechnique Universitaire de Marseille (Polytech-Marseille)
Département  Informatique
5 ième année – Option Ingénierie des Systèmes d'Information

2021-2022


TITRE DU COURS : ENTREPOTS DE DONNEES


NOM DE L'INTERVENANT : Bernard ESPINASSE


OBJECTIFS VISES PAR LE COURS


Ce cours s'inscrit dans le domaine de « l'informatique décisionnelle (ID) » ou« Business Intelligence (BI) » en anglais. Après avoir défini ce que recouvrait la DI/BI, est introduit le concept d'ED et l'analyse en ligne OLAP. On s'intéresse ensuite à la conception d'un ED tant à un niveau conceptuel qu'à un niveau logique en privilégiant la méthode basée sur le Dimensional Fact Model (DFM) définie par Golfarelli et Rizzi. Les grandes approches d'implantation des ED sont présentées : l'approche ROLAP, l'approche MOLAP, et l'approche hybride HOLAP. Des langages informatiques permettant de faire de l'analyse OLAP d'ED sont introduits : des récentes extensions du langage SQL3, au langage MDX proposé par Microsoft.

Un enseignement pratique (EP) complètera ce cours et permettra de réaliser un mini-projet sur un entrepôt de données avec une suite logicielle de ID/BI


PROGRAMME (séances de 2 heures)

Séance 1 : Introduction à l'Informatique Décisionnelle (Business Intelligence)
- Émergence de l'Informatique Décisionnelle
- Pilotage de l'entreprise et informatique décisionnelle (BI)
- De l'OLTP à l'OLAP
- De la Business Intelligence à la Business Analytics
- Un exemple de l'ID/BI dans l'entreprise : la relation client
Supports:
      Introduction à l'informatique décisionnelle

PARTIE 1 : ENTREPOTS DE DONNEES (DATA WAREHOUSE)

Séance 2 : Introduction aux entrepôts de données (ED)
- Les entrepôts de données
- Modélisation et implantation d'un entrepôt de données
- Alimentation d'un entrepôt de données (ETL)
- Exploitation d'un entrepôt de données (OLAP)
- Domaines d'application et exemples d'entrepôts de données
Supports:
      Introduction aux entrepôts de données

Séance 3 : Modélisation et conception conceptuelle d'un ED
Le modèle « Dimensional Fact Model – DFM »
-    Problématique générale de la conception d'un entrepôt de données: approches et démarches
-    Concepts de bases du modèle DFM
Elaboration d'un modèle conceptuel d'entrepôt avec la méthode DFM
-    Dérivation d'un modèle conceptuel à partir du schéma relationnel d'une base de données opérationnelle
-    Dérivation d'un modèle conceptuel à partir du schéma Entité-Relation d'une base de données opérationnelle
Supports:
      DFM-Dimensional Fact Model definition
      DFM development from R and E/R schemata

Séance 4 : Analyse en ligne d’entrepôt : OLAP (On-Line Analytical Processing)
-    Introduction et problématique de l'OLAP
-    Entrepôt et OLAP, OLAP versus OLTP, exemple d’analyses d’un ED
-    Opérations élémentaires OLAP : opérations de restructuration (rotate, switch, split, nest, push, pull)
-    Opérations de granularité (roll-up, drill-down)
-    Opérations ensemblistes (slide, dice, jointure (drill-across), data cube
Supports:
         OLAP

Séance 5 : TD1 – Modélisation et conception conceptuelles d'un ED
-    Exercices de modélisation conceptuelle d'EDs

Séance 6 : Approches d’implantation des ED : les systèmes OLAP
-    Introduction aux systèmes OLAP
-    Systèmes ROLAP : techniques d'indexation ROLAP,
      exécution de requêtes en ROLAP : précalcul des agrégats,
      sélection et matérialisation des vues, fragmentation
      quelques produits de technologie MOLAP, 
-    Systèmes MOLAP : techniques de stockage, densité et compression,
     agrégation et calcul des agrégats, coût MOLAP des opérations typiques,
     forces et faiblesses de la technologie MOLAP, quelques produits de technologie MOLAP, …
-    Systèmes HOLAP : technologie, quelques produits.
Supports:
         Systèmes OLAP

Séance 7 : Modélisation et conception logique d'un ED
-    Modélisation multidimensionnelle de base et avancée
-    Dérivation de schémas relationnels à partir de schémas factuels conceptuels
-    Exemples de modélisation logique d’ED
Supports:
        DW Logical Design

Séance 8 : TD2 – Modélisation et conception logique ROLAP d'un ED
-    Exercices de modélisation logique ROLAP d'EDs

Séance 9 : Extensions SQL99 (SQL 3) pour l'OLAP
-    Extension SQL 99 (SQL 3) pour l'OLAP
-    Rollup, Cube, Group by cube, Grouping sets, …
-    OLAP dans divers systèmes (Oracle, Terradata, …)
Supports:
        Extension du langage SQL à l'OLAP

Séance 10 : Introduction au langage MDX (Multi-Dimensional eXtensions) pour l'OLAP
-    Syntaxe de base de MDX
-    Membres et tuples dans  MDX
-    Fonctions sur les membres et les ensembles (Sets) de MDX
-    Expressions avancées de MDX
Supports:
        Le langage MDX pour l'OLAP
     
Séance 11 à 18 : TP, prise en main pratique (TP) d'une suite logicielle de ID/BI et mini projet.

Examen le …

**********************************************************************
RESSOURCES POSGRESQL

- Télécharger le SGBD Postgresql (PC, mac, linux, ...)
      Postgresql
- Télécharger le programme d'administration du SGBD Postgresql: pgadmin3
      pgadmin3

**********************************************************************
RESSOURCES POUR LE TP SUR L'ENTREPOT DE DONNEES "ACCIROUTE"- Sujet TP entrepôt  "AcciRoute":

- ED Acciroute
        ED Acciroute
- Document explicatif JRUBIK/MONDRIAN:
        JRubik/Mondrian
- Document explicatif SAIKU/MONDRIAN:
        Saiku/Mondrian
- Sujet/rendu:
        Sujet-rendu (.pdf)
        Sujet-rendu (.doc)
- Télécharger le SGBD Postgresql : http://www.postgresql.org/download/
        Postgresql
- Télécharger le programme d'administration du SGBD Postgresql : pgadmin3 et phppgadmin

- Script cube Acciroute0 :
        Cube Acciroute0 (.xml)


**********************************************************************
RESSOURCES POUR LE TP SUR L'ENTREPOT DE DONNEES "POLYMARKET"

- ED Polymarket.

       ED Polymarket

- Document explicatif JRUBIK/MONDRIAN:
        JRubik/Mondrian
- Présentation de l'entrepôt "PolyMarket":
        Entrepot
- Sujet/rendu:
        Sujet-rendu (.pdf)
        Sujet-rendu (.doc)

- Script .sql de Création, Remplissage et Suppression de la base de données de l'entrepôt "PolytMarket"
        BD Polymarket

- Télécharger JRUBIK (JRubik-bin-0.9.8.zip):
        JRubik
        Manuel de JRubik
        Utilisation de JRubik en 20 figures
- Script cube Vente:
        Cube Vente  (.xml)


BIBLIOGRAPHIE