Informatica PowerCenter est un ETL (Extract Transform Load) qui permet d’extraire des données d’origine hétérogènes (fichier plat, Oracle, DB2,…) à partir de connecteurs servant à importer ou exporter les données dans des applications (datawarehouse, datamart,…), puis de transformateurs qui manipulent les données (filtres, jointures, agrégation,…) et de mises en correspondance (mapping).

Les solutions d’ETL sont apparues pour le chargement régulier de données dans des entrepôts.

PowerCenter fait partie de la famille des logiciels graphiques de description des référentiels et de pilotage des traitements. Les autres familles étant :
– Les logiciels générateurs de scripts et de programme (première génération d’ETL)
– Les logiciels liés à des environnements particuliers (ex : Hyperion, oracle datamart Builder,…)

L’architecture Informatica PowerCenter est composé de plusieurs composants qui communiquent les avec les autres en architecture client /serveur.
PowerCenter Repository : c’est le dictionnaire des métadonnées (description des bases de données, des utilisateurs, des serveurs,…)
PowerCenter Repository Server: permet la gestion des connexions au référentiel depuis l’application cliente. C’est le pilote des accès aux repositories.
PowerCenter Client : c’est le module de conception du processus d’alimentation et l’exécution des traitements. Les applications disponibles sont :

  • Repository Manager : gestion des référentiels, administration des projets et des utilisateurs, fonction d’analyse d’impact, droits.
  • Repository Server Application Console : gestions des connexions, des objets verrouillés, des logs, des sauvegardes.
  • Designer : module client qui permet la conception du mapping. Extraire, transformer et charger dans une base de données.
  • Workflow Manager : ordonnancement et paramétrage des mappings.
  • Workflow Monitor : suivi des traitements, visualisation des logs.

Le Moteur (Informatica Server) qui exécute les processus d’alimentation. Il extrait les données de chacune des sources, effectue les transformations et charge les bases cibles. Les données sont stockées en mémoire pour optimiser les performances.

Points forts

Gestion d’un nombre de traitements importants ;
Volume de données conséquent
Fréquence des chargements élevée
Processus évolutif
Gestion des métadonnées

 

Points Faibles

La non réutilisabilité des objets développés
Pas de souplesse de l’outil pour un répondre aux enjeux du prototypage

 

Architecture générale PowerCenter

Tags:

Leave a Reply