Le Data Builder sur SAP Data Warehouse Cloud

Le Data Builder sur SAP Data Warehouse Cloud

Introduction

Le traitement des données et leur modélisation représentent un enjeu majeur pour la prise de décision. La solution de SAP Data Warehouse Cloud (DWC) est un choix novateur parmi les différents outils d’entrepôt de données existants. Auparavant présenté sur ce blog, cet outil de dernière génération est régulièrement mis à jour et des fonctionnalités sont continuellement ajoutées pour qu’il devienne un véritable couteau suisse de la Business Intelligence tout en conservant une expérience intuitive.

Zoom sur le Data Builder de SAP DWC, situé au cœur de la gestion optimale des tables et modèles.

Présentation du Data Builder

Le Data Builder de DAP DWC est utilisé pour importer les sources de données dans un premier temps (en import ou en tables distantes), et pour modéliser la donnée dans un deuxième temps.

Le Data Builder est géré par les utilisateurs au sein d’un espace de travail SAP DWC. Plusieurs espaces de travail peuvent cohabiter sur un tenant SAP DWC (DEV, PROD, etc.). Ces espaces sont créés et maintenus par les utilisateurs disposant des rôles correspondants. Les objets contenus dans le Data Builder sont transportables et modulables d’un espace à un autre.

Le Data Builder sert au traitement des objets de données (tables, vues…) au sein d’un espace de travail et dispose de fonctionnalités organisées selon le processus de modélisation suivant :

Fonctionnalités du Data Builder

Gestion des tables dans l’espace de travail

Une fois la source de données (S/4 HANA, SAP HANA, SAP BW, etc.) connectée, la première étape consiste à créer les tables dans le Data Builder, en masse ou individuellement, qui pourront ensuite être utilisées dans les vues. SAP DWC offre la possibilité d’importer une table sous deux formats : les remote tables, et les data flows.

  • Remote Table (table distante)

Les remote tables, ou tables distantes, sont des tables dont seules les métadonnées sont importées. Les données seront lues ultérieurement, lors de la consultation du report aval ou du data preview. Elles s’importent depuis l’écran d’accueil du Data Builder via cette commande Ecran d'accueil - Data Builder qui permet d’accéder aux objets (tables et vues) des différents répertoires de la source et de les importer. En créant un espace dédié contenant un ensemble de tables, il est possible d’importer des tables en masse très rapidement. Leur utilisation nécessite comme prérequis l’installation d’un Data Provisioning Agent (DPA), pour les systèmes on-premise disponible sur help.sap.com.

  • Data flow (flux de données)

Les Data flows sont des tables répliquées depuis la source de données, contenant la définition mais aussi les données de la table d’origine. Pour qu’un Data Flow soit mis en place dans le Data Builder, il convient de préparer la connexion de la source de SAP DWC dans la section des caractéristiques :

Features Data Flow - SAP DWC

La mise en place d’un flux de données nécessite la création de deux objets :

Le premier objet (encadré rouge) représente la source du data flow (CDS View ou Custom CDS, accessibles depuis le volet de sélection à gauche), le second représente la table de destination du flux de données. De nombreuses propriétés du flux de données sont paramétrables dans le volet de droite.

Restons connectés !

Inscrivez-vous à la newsletter Rapid Views !​

Soyez notifiés de nos derniers articles de blog, de nos prochains webinars et nos actualités !

Modélisation des vues

La construction de vues modélisées s’effectue via le Data Builder de SAP DWC. Ce sont ces vues qui permettent de croiser les données nécessaires à l’élaboration des reportings du processus décisionnel. Elles contribueront alors à l’industrialisation d’une méthode de reporting décisionnel.

Ces vues, en effet, offrent à l’utilisateur la possibilité de manipuler des jointures entre différentes tables, des agrégations et unions, des champs calculés et filtres, le tout encapsulé dans une couche sémantique pertinente pour les utilisateurs finaux. Les libellés (noms techniques et fonctionnels) sont lus par les outils de reporting finaux comme SAP Analytics, Power BI, Tableau (liste non exhaustive).

Data modeler RapidViews
SQL RapidViews

Les utilisateurs du data modeler ont le choix entre une construction graphique – construction low-code avec drag-and-drop – et une construction scriptée utilisant le langage SQL.

La vue graphique affichée ci-dessous a par exemple mobilisé les ressources suivantes lors de sa construction :

  • Deux sources, drag-and-droppées depuis le volet de gauche : les vues de fait Delivery et Sales Order
  • La vue Delivery est ensuite encapsulée dans une projection Vue delivery - Data Builder  qui permet de transformer certaines données : masquer des champs, filtrer des données, ajouter des champs calculés. Il est possible d’en observer le résultat grâce à un data preview.
  • Cette projection est ensuite encapsulée dans une agrégation  Agrégation projection - Data Builder dans laquelle il est possible de sommer les mesures selon les attributs conservés dans l’agrégation.
  • Les deux vues sont ensuite croisées au sein d’un left join   Left join champs à mapper   qui permet de sélectionner les champs clé à mapper.
  • Ces données sont ensuite manipulables dans une projection ou une agrégation.
  • Le dernier objet du modèle est la couche sémantique  Couche sémantique Paramétrable - Data Builder paramétrable : libellés, attributs ou mesures, champs masqués, associations, options de la vue…  Les associations permettent de relier une vue de fait aux dimensions afin de créer un datamart.

Deux autres fonctionnalités proposent l’analyse de data lineage et d’analyse d’impact à échelle d’un champ ou d’une table :

Un article dédié du blog traite de façon détaillée le sujet de la construction des vues graphiques sur un cas d’étude du module FI-CO.

Entity Relationships Models

En suivant le processus de modélisation du data builder, après avoir importé des tables et conçu des vues d’analyse, l’utilisateur a la possibilité de les intégrer dans un modèle relationnel.

Les modèles E/R sont des descriptions graphiques des relations entre les modèles – tables et vues – précédemment élaborés qui forment un sous-ensemble.

Conçu pour améliorer l’expérience utilisateur, les modèles E/R sont très utiles pour offrir une vision globale des tables et vues développées dans l’espace.  Le modèle E/R fait la passerelle entre concepteurs et utilisateurs métier. D’un côté, le concepteur peut modifier directement des éléments des entités composant le modèle E/R : le déploiement de celui-ci active toutes les modifications menées sur les vues du modèle E/R en cascade. Il sera plus efficace de travailler directement sur ce modèle pour effectuer des modifications sur plusieurs vues. De l’autre côté, le concepteur partagera ces modèles auprès des utilisateurs finaux qui disposeront d’un aperçu de l’agencement des tables et vues comme source de leurs rapports.

Voici l’exemple d’un E/R Model construit pour afficher un aperçu de l’univers SD (Sales Distribution). L’encadré rouge propose des fonctions d’édition (ouvrir l’édition d’une vue, manipuler les associations du modèle) ; le volet de détail à droite permet de consulter de nombreuses informations (mesures, attributs, associations), concernant le modèle ou l’entité sélectionnée.

Tasks Chains

La chaîne de tâches permet de planifier ou lancer manuellement l’exécution de plusieurs tâches en série et de façon ordonnée. Cet outil se révèle très utile pour organiser dans un même espace les mises à jour de données.

Dans une task chain, les tâches d’exécution sont sélectionnées automatiquement selon le type d’objet : réplication (remote table), rendre persistant (vue), exécution (data flow). L’utilisateur peut consulter l’activité de tâche.

Enfin, il est possible de planifier l’envoi d’une notification ou d’un e-mail aux utilisateurs lorsque les objets concernés ont été mis à jour. Certaines fonctions incluses dans le data builder de DWC permettent la personnalisation de leur contenu, des destinataires, de l’objet…

La construction d’une task chain suit les principes de drag-and-drop et se présente comme les autres outils du data builder, avec le volet de sources disponible à gauche, l’aperçu au centre et le volet de paramétrage à droite :

Conclusion

Outre sa gestion intuitive, le data builder présente de nombreux avantages ; les fonctionnalités de data lineage et d’impact analysis, superposées avec un modèle E/R pertinent, s’avère très efficace dans l’organisation du traitement des données. SAP DWC accorde même un choix à ses utilisateurs en proposant une conception SQL ou graphique des vues pour une prise en main agréable.

Les clients SAP DWC disposent d’un outil complémentaire : le Business Builder, dans lequel il est possible de concevoir des Datamarts croisant en un clin d’œil les vues de fait avec différentes dimensions sous forme de schéma en étoile.

L’avis de l’expert

Le Data Builder de SAP Data Warehouse Cloud représente un excellent choix en matière de Business Intelligence. Continuellement amélioré par son éditeur SAP, les utilisateurs de SAP DWC disposent d’un entrepôt de données efficace et pertinent qui répondra aux besoins métier des clients, qu’ils utilisent SAP On-premise ou la solution cloud.

Sa compatibilité avec les nombreuses solutions de visualisation répond brillamment aux enjeux clés du moment. Attention cependant aux erreurs au moment du déploiement d’une vue : les blocages ne sont pas toujours bien expliqués, un délai de prise en main est nécessaire pour bien identifier les points bloquants.

Les consultants de RapidViews relèvent cependant de nombreuses fonctionnalités intuitives, basiques ou avancées, qui en font un bon outil de gestion de données avant restitution aux services opérationnels.

Newsletter
Rapid Views

Soyez notifiés de nos derniers articles de blog, de nos prochains webinars et nos actualités !

Les derniers articles

Demandez gratuitement notre livre blanc sur la solution SAP Datasphere