
contactez nous


Afin de bien comprendre OLTP et OLAP, il est nécessaire de fournir un peu de contexte. Au début de l'existence des logiciels, les données étaient généralement stockées dans un seul fichier. Cependant, alors qu'elle commençait à s'attaquer à des problèmes plus importants, systèmes de gestion de bases de données relationnelles (DBMS) a pris d'assaut le marché. Au cours des décennies suivantes, ces solutions ont été proposées à tous pour le stockage des données.
Avec l'avènement du web, tout a radicalement changé. Les moteurs de recherche et les réseaux sociaux modélisent désormais des données dans des domaines dans lesquels les relations entre les données ne sont pas facilement identifiables ou, parfois, ne sont même pas nécessaires (par exemple, les moteurs de recherche indexent des documents).
Néanmoins, certains termes de l'ancien monde sont encore utilisés aujourd'hui, et il est important de les aborder avec une approche moderne. Deux d'entre eux sont, précisément, OLTP et OLAP. Mais pour un contexte général, regardons l'image suivante qui montre la relation entre OLTP et OLAP.
Avant d'identifier les principales différences entre OLTP contre OLAP, donnons d'abord un contexte général concernant leur relation. Regardez l'image suivante qui montre la relation entre OLTP et OLAP.
L'image ci-dessus souligne que OLTP et OLAP ne sont pas des approches concurrentes à la même problématique, mais plutôt à des processus qui se complètent. En général, les systèmes OLTP fournissent les données sources aux entrepôts de données, tandis que les systèmes OLAP aident à analyser les données.
Vous trouverez ensuite une explication plus approfondie de chacun de ces termes, suivie d'une description de la manière dont OLTP et OLAP se complètent.
Le terme OLTP fait référence à Traitement des transactions en ligne. Il est souvent utilisé pour mentionner les bases de données qui stockent et gèrent des données pertinentes pour les opérations quotidiennes d'un système ou d'une entreprise. Dans le passé, ce terme était généralement lié aux bases de données relationnelles en activité, dont l'objectif principal était de recueillir des données à partir de ce qui se passait dans un contexte donné.
En bref : l'OLTP est utilisé pour stocker et gérer les données pour les opérations quotidiennes.
Comme le stockage des informations sur un magasin de données OLTP était souvent essentiel pour l'entreprise, des efforts considérables ont été déployés pour garantir Atomicité, Cohérence, Isolement et Durabilité (ACIDE) des données. Les données stockées selon ces quatre principes sont marquées comme conforme à l'ACID, et c'est ici systèmes de gestion de bases de données relationnelles exceller.
Mais le fait de disposer d'une banque de données conforme à l'ACID ne signifie pas que nous n'avons pas à faire d'efforts supplémentaires pour garantir la conformité de nos données à ces principes : la façon dont nous traitons les données est importante. Par exemple, comment pouvons-nous garantir la cohérence des données si nous autorisons la redondance dans notre magasin de données ?
Si nous stockons les adresses des clients, il est important de veiller à ce que l'adresse soit mise à jour partout lorsque le client déménage. Mais le stockage des adresses à plusieurs endroits rend difficile la conservation des données dans un état cohérent. C'est pourquoi les bases de données relationnelles sont souvent conçues pour correspondre aux 5e forme normale - une façon de concevoir des données relationnelles qui évite la redondance.
Comme indiqué précédemment, le monde a changé depuis la définition du terme OLTP et, de nos jours, il est facile de stocker des données sur bases de données non relationnelles. La plupart de ces banques de données ne respectent que certains des quatre principes de l'ACID. Selon le cas d'utilisation, vous pouvez vous détendre sur un ou plusieurs de ces principes en échange d'autres avantages (rapidité, évolutivité, etc.).
Par exemple, si nous stockons des « j'aime » dans une publication sur un réseau social, est-il vraiment important de s'assurer que le nombre de likes est exact à 100 % ? Ou est-il acceptable d'afficher 995 likes au lieu de 998 en échange d'une réponse plus rapide à des millions d'utilisateurs ?
Comme OLTP fait référence au traitement des transactions en ligne, nous constatons que le terme n'est pas limité aux bases de données relationnelles ni même aux bases de données ACID entièrement conformes. Il fait simplement référence à la façon dont ces magasins de données sont utilisés. Si, par exemple, nous utilisons un stockage de données documentaires (par ex. MongoDB) pour stocker et traiter les données relatives aux opérations quotidiennes d'une application sociale (par exemple pour enregistrer des utilisateurs, stocker des likes, etc.), nous pouvons dire qu'il s'agit d'OLTP.
Le terme OLAP fait référence à Traitement analytique en ligne, et est souvent utilisé pour mentionner les bases de données qui stockent et gèrent des données pertinentes à des fins d'analyse et de prise de décision.
OLAP est étroitement lié à Intelligence d'affaires (BI), une spécialisation de développement de logiciels visant à fournir des applications pour l'analyse commerciale. En d'autres termes, l'objectif de la BI est de permettre aux cadres supérieurs d'interroger et d'explorer les données sans l'aide du personnel informatique.
En bref : OLAP est utilisé pour analyser les données et prendre des décisions.
La plus grande avancée apportée par ce domaine a été la capacité de générer des rapports à la volée. Cela a permis de ne plus avoir à appeler le service informatique pour demander un rapport personnalisé ou pour automatiser la génération de rapports spécifiques. UNE Système BI peut désormais répondre à des questions dont les développeurs n'avaient pas besoin de savoir à l'avance qu'elles allaient être posées.
Les systèmes BI sont rendus possibles en organisant les données sous une forme appelée Hypercube. Ce formulaire explore les nombreuses dimensions des données et permet aux utilisateurs de global ou explorer vers le bas données en parcourant les dimensions du cube.
Ce qui est amusant, c'est qu'avec la bonne interface, la direction de haut niveau peut générer des rapports à la volée, sans l'aide de l'informatique.
Les systèmes OLAP peuvent être mis en œuvre à l'aide de bases de données relationnelles (par exemple MySQL), et cette technique est souvent nommée ROLAP (OLAP relationnel). Mais, pour cela, nous devons concevoir la base de données non pas dans la 5e forme normale mais dans 3e forme normale.
Nous pouvons vivre avec des données redondantes lors de l'analyse des données. Ce qui compte vraiment, c'est la capacité de naviguer dans les différentes dimensions des données. C'est là que ROLAP brille, car un schéma de base de données sous sa troisième forme normale convient aux agrégations et aux explorations.
Comme indiqué précédemment, alors que l'OLTP fournit un rapport instantané sur l'activité commerciale, l'OLAP, quant à lui, se concentre sur la génération d'analyses de données et d'informations à partir des données compilées. L'OLTP et l'OLAP se complètent car la qualité des informations d'OLAP dépend de la qualité du pipeline de données résultant de l'OLTP.
Découvrez les principales différences entre OLTP et OLAP dans le tableau suivant :
Lorsque l'on rencontre les termes OLTP et OLAP pour la première fois, il est facile de se demander lequel est le meilleur, alors qu'en fait, on devrait se demander : comment l'un complète l'autre ?
Nous savons maintenant que :
C'est exactement ainsi qu'ils sont utilisés dans une entreprise existante.
Les données de la partie supérieure de l'exemple ci-dessus (base de données RH, CRM, système de facturation) sont généralement traitées par lots, souvent du jour au lendemain, via un processus appelé Extraire, transformer et charger (ETL).
L'ETL est le nom donné à l'opération qui collecte des données provenant de plusieurs sources OLTP et les place dans un entrepôt de données OLAP, permettant une analyse intersystème. Dans la partie inférieure de la figure ci-dessus, vous pouvez voir que les données ont été correctement stockées et organisées dans le Cube OLAP.
Ainsi, les personnes effectuant l'analyse peuvent travailler avec des informations à jour et prendre des décisions en temps opportun sans perturber les opérations.
Cet article explique les principales différences entre OLAP et OLTP et explique comment ils se complètent.
Chaque jour, de nouvelles données sont collectées ; toutefois, nous devons organiser et analyser ces mêmes données pour prendre des décisions éclairées et obtenir des informations précieuses. Par conséquent, une organisation dispose généralement de deux types de capacités de traitement des données : OLTP et OLAP.
Comme nous l'avons décrit tout au long de l'article, l'OLTP et l'OLAP jouent tous deux un rôle crucial en ce qui concerne les données, malgré leurs approches différentes. Nous espérons que cet article vous a été utile !
Vous avez trouvé cet article utile ? Ceux-ci vous plairont peut-être aussi !
CEO @ Imaginary Cloud et co-auteur du livre Product Design Process. J'aime la nourriture, le vin et le Krav Maga (pas nécessairement dans cet ordre).
People who read this post, also found these interesting: