Fermer

octobre 31, 2019

OLAP et Hadoop: les 4 différences à connaître


OLAP et Hadoop ne sont pas identiques. OLAP est une technologie permettant d'effectuer des analyses multidimensionnelles telles que la génération de rapports et l'exploration de données. Il existe depuis 1970. Hadoop est une technologie permettant d'effectuer des calculs massifs sur des données volumineuses. Environ depuis 2002. Ils peuvent être utilisés ensemble, mais il existe des différences entre le traitement de données Hadoop / MapReduce et le traitement OLAP classique. Pour cette discussion, évitons les problèmes de prix et supposons également que les besoins de l’entreprise ont été bien pensés.

1 Type de traitement

Pour les transactions et l’exploration de données, utilisez OLAP. Mais pour l'analyse et la découverte de données, utilisez Hadoop. Pour les données / processus nettoyés connus qui produisent des résultats définitifs d'intégrité élevée, utilisez OLAP. Utilisez Hadoop pour les données / processus inconnus plus complexes qui donnent des résultats suggestifs. Par exemple, utilisez OLAP pour les capteurs météorologiques, mais Hadoop pour les modèles météorologiques. OLAP peut effectuer des lectures rapides sur des serveurs haut de gamme. Hadoop peut effectuer des lectures et des écritures rapides sur des services distribués.

2 Taille des données

OLAP est conçu pour fonctionner sur des données pré-agrégées à partir d'un grand nombre d'enregistrements. Il a un bon débit de plus d'enregistrements dans un entrepôt de données. Hadoop est conçu pour fonctionner sur des données massives non agrégées provenant d'un nombre moins élevé d'objets. Il a un débit élevé d'objets volumineux dans un lac de données ( Harris n.d.). L'entreprise a-t-elle besoin de davantage d'objets plus petits ou moins d'objets plus grands? Par exemple, si la somme des enregistrements est importante, alors OLAP est bon. Mais si l’analyse audio est importante, Hadoop est bon. Dans l’ensemble, Hadoop a un débit supérieur.

3 Interaction

OLAP s’exécute sur SQL suivant les principes de normalisation de la base de données. Hadoop fonctionne sur HQL en suivant des concepts orientés objet. SQL est basé sur un modèle de base de données relationnelle. Mais HQL combine une programmation orientée objet avec des concepts de base de données relationnelle ( Jeyakanth 2017). OLAP est bon pour mettre à jour, insérer, sélectionner et supprimer. Hadoop convient à tout autre type d'objet.

4 Structure de données

OLAP est destiné aux modèles dimensionnels structurés. Il évolue bien verticalement. OLAP aime plus de choses identiques dans une table relationnelle. Tandis que Hadoop est conçu pour les données non structurées et qu'il évolue bien horizontalement. Hadoop aime plus de choses différentes avec des paires clé / valeur. Ainsi, les sources de données sont une considération importante. Par exemple, OLAP pour davantage de transactions de tickets de police et Hadoop pour plus de données de caméra corporelle. Globalement, Hadoop répondra mieux aux besoins de stockage maximaux.

Conclusion, OLAP et Hadoop

Dans la plupart des cas, Hadoop peut faire ce que OLAP fait. OLAP peut être nécessaire s'il existe un système hérité à prendre en compte. Ou vous avez seulement besoin de signaler. Ou la maturité technologique est un moteur. Cependant, en général, je me penche vers Hadoop / MapReduce over OLAP.

Pour plus d'informations:

Perficient Data

Perficient Cloud

Perfient Big Data




Source link