Ecole
Polytechnique Universitaire de Marseille (Polytech-Marseille)
Département
Informatique
5 ième année
–
Option Ingénierie des Systèmes d'Information
2021-2022
TITRE DU COURS : ENTREPOTS DE DONNEES
NOM DE L'INTERVENANT : Bernard
ESPINASSE
OBJECTIFS VISES PAR LE COURS
Ce cours s'inscrit dans le domaine de « l'informatique décisionnelle (ID)
»
ou« Business Intelligence (BI) » en anglais. Après avoir défini ce que
recouvrait la DI/BI, est introduit le concept d'ED et l'analyse en ligne
OLAP.
On s'intéresse ensuite à la conception d'un ED tant à un niveau conceptuel
qu'à un niveau logique en privilégiant la méthode basée sur le Dimensional
Fact Model (DFM) définie par Golfarelli et Rizzi. Les grandes approches
d'implantation des ED sont présentées : l'approche ROLAP, l'approche
MOLAP,
et l'approche hybride HOLAP. Des langages informatiques permettant de
faire de
l'analyse OLAP d'ED sont introduits : des récentes extensions du langage
SQL3,
au langage MDX proposé par Microsoft.
Un enseignement pratique (EP) complètera ce cours et permettra de réaliser
un
mini-projet sur un entrepôt de données avec une suite logicielle de ID/BI
PROGRAMME (séances de 2 heures)
Séance 1 : Introduction à l'Informatique
Décisionnelle (Business Intelligence)
- Émergence de l'Informatique Décisionnelle
- Pilotage de l'entreprise et informatique décisionnelle (BI)
- De l'OLTP à l'OLAP
- De la Business Intelligence à la Business Analytics
- Un exemple de l'ID/BI dans l'entreprise : la relation client
Supports:
Introduction
à
l'informatique décisionnelle
PARTIE 1 : ENTREPOTS DE DONNEES (DATA WAREHOUSE)
Séance 2 : Introduction aux entrepôts de
données (ED)
- Les entrepôts de données
- Modélisation et implantation d'un entrepôt de données
- Alimentation d'un entrepôt de données (ETL)
- Exploitation d'un entrepôt de données (OLAP)
- Domaines d'application et exemples d'entrepôts de données
Supports:
Introduction
aux
entrepôts de données
Séance 3 : Modélisation et conception
conceptuelle d'un ED
Le modèle « Dimensional Fact
Model
– DFM »
- Problématique générale de la conception d'un entrepôt
de données:
approches et démarches
- Concepts de bases du modèle DFM
Elaboration d'un modèle
conceptuel
d'entrepôt avec la méthode DFM
- Dérivation d'un modèle conceptuel à partir du schéma
relationnel
d'une base de données opérationnelle
- Dérivation d'un modèle conceptuel à partir du schéma
Entité-Relation d'une base de données opérationnelle
Supports:
DFM-Dimensional
Fact Model
definition
DFM
development from R
and E/R schemata
Séance 4 : Analyse en ligne d’entrepôt :
OLAP (On-Line Analytical Processing)
- Introduction et problématique de l'OLAP
- Entrepôt et OLAP, OLAP versus OLTP, exemple d’analyses d’un
ED
- Opérations élémentaires OLAP : opérations de
restructuration
(rotate, switch, split, nest, push, pull)
- Opérations de granularité (roll-up, drill-down)
- Opérations ensemblistes (slide, dice, jointure
(drill-across), data
cube
Supports:
OLAP
Séance 5 : TD1 – Modélisation et
conception conceptuelles d'un ED
- Exercices de modélisation conceptuelle d'EDs
Séance 6 : Approches d’implantation des
ED
: les systèmes OLAP
- Introduction aux systèmes OLAP
- Systèmes ROLAP : techniques d'indexation ROLAP,
exécution de requêtes en ROLAP : précalcul des
agrégats,
sélection et matérialisation des vues, fragmentation
quelques produits de technologie MOLAP,
- Systèmes MOLAP : techniques de stockage, densité et
compression,
agrégation et calcul des agrégats, coût MOLAP des
opérations
typiques,
forces et faiblesses de la technologie MOLAP, quelques
produits de
technologie MOLAP, …
- Systèmes HOLAP : technologie, quelques produits.
Supports:
Systèmes
OLAP
Séance 7 : Modélisation et conception
logique d'un ED
- Modélisation multidimensionnelle de base et avancée
- Dérivation de schémas relationnels à partir de schémas
factuels
conceptuels
- Exemples de modélisation logique d’ED
Supports:
DW
Logical
Design
Séance 8 : TD2 – Modélisation et
conception logique ROLAP d'un ED
- Exercices de modélisation logique ROLAP d'EDs
Séance 9 : Extensions SQL99 (SQL 3) pour
l'OLAP
- Extension SQL 99 (SQL 3) pour l'OLAP
- Rollup, Cube, Group by cube, Grouping sets, …
- OLAP dans divers systèmes (Oracle, Terradata, …)
Supports:
Extension
du langage
SQL à l'OLAP
Séance 10 : Introduction au langage MDX
(Multi-Dimensional eXtensions) pour l'OLAP
- Syntaxe de base de MDX
- Membres et tuples dans MDX
- Fonctions sur les membres et les ensembles (Sets) de
MDX
- Expressions avancées de MDX
Supports:
Le
langage MDX pour
l'OLAP
Séance 11 à 18 : TP, prise en main
pratique
(TP) d'une suite logicielle de ID/BI et mini projet.
Examen le …
**********************************************************************
RESSOURCES POSGRESQL
- Télécharger le SGBD Postgresql
(PC,
mac, linux, ...)
Postgresql
- Télécharger le programme d'administration du SGBD Postgresql: pgadmin3
pgadmin3
**********************************************************************
RESSOURCES POUR LE TP SUR L'ENTREPOT DE DONNEES "ACCIROUTE"- Sujet
TP
entrepôt "AcciRoute":
- ED Acciroute
ED
Acciroute
- Document explicatif JRUBIK/MONDRIAN:
JRubik/Mondrian
- Document explicatif SAIKU/MONDRIAN:
Saiku/Mondrian
- Sujet/rendu:
Sujet-rendu
(.pdf)
Sujet-rendu
(.doc)
- Télécharger le SGBD Postgresql : http://www.postgresql.org/download/
Postgresql
- Télécharger le programme d'administration du SGBD Postgresql : pgadmin3
et phppgadmin
- Script cube Acciroute0 :
Cube
Acciroute0 (.xml)
**********************************************************************
RESSOURCES POUR LE TP SUR L'ENTREPOT DE DONNEES
"POLYMARKET"
- ED Polymarket.
- Document explicatif JRUBIK/MONDRIAN:
JRubik/Mondrian
- Présentation de l'entrepôt "PolyMarket":
Entrepot
- Sujet/rendu:
Sujet-rendu
(.pdf)
Sujet-rendu
(.doc)
- Script .sql de Création, Remplissage et Suppression de la base de
données de l'entrepôt "PolytMarket"
BD
Polymarket
- Télécharger JRUBIK (JRubik-bin-0.9.8.zip):
JRubik
Manuel
de
JRubik
Utilisation
de
JRubik en 20 figures
- Script cube Vente:
Cube
Vente
(.xml)
BIBLIOGRAPHIE