Une plate-forme d'analyse avancée pour gérer le cycle de vie complet des données

Dell Technologies et Cloudera ont collaboré pour fournir les meilleures solutions d'analyse sur une infrastructure optimisée pendant près d'une décennie, depuis l'aube de l'ère du Big Data. Pendant cette période, nous avons développé conjointement de nombreuses solutions pour des applications d'analyse flexibles, évolutives et de classe entreprise basées sur le logiciel Cloudera et l'infrastructure Dell EMC.
Ces solutions analytiques se sont développées pour englober bien plus qu'Apache Hadoop. La plate-forme de données moderne comprend une multitude de capacités et d'applications qui couvrent le cycle de vie complet des données, y compris l'ingestion et la collecte de données, l'ingénierie et l'enrichissement des données, l'entreposage de données, l'analyse de données, la création de rapports et même l'analyse prédictive avec l'IA et l'apprentissage automatique.
Notre dernière version est une conception validée par Dell Technologies pour l'analyse intitulée Data Management with Cloudera Data Platform on Intel-powered Dell EMC Infrastructure. Cette version comprend la base de cloud privé Cloudera Data Platform (CDP) 7.1.7 et les serveurs Dell EMC PowerEdge avec des processeurs évolutifs Intel® Xeon® de 3e génération.
La base de cloud privé CDP, anciennement connue sous le nom de centre de données CDP, contient le meilleur des Hortonworks Data Platform (HDP) et Cloudera Distribution for Hadoop (CDH) ainsi que de nombreuses nouvelles fonctionnalités et capacités. De plus, il contient l'ensemble le plus complet d'améliorations et de chemins de mise à niveau depuis les versions précédentes à ce jour.

Dell
CDP Private Cloud Base est la version sur site de Cloudera Data Platform et comprend le composants principaux suivants :
- Cloudera Manager est l'outil complet de gestion et d'administration qui prend en charge le déploiement et la configuration automatisés, la surveillance et la création de rapports personnalisables, un dépannage robuste mais sans effort et une maintenance sans interruption.
- Cloudera SDX est l'expérience de données partagées. Indépendamment des couches de calcul et de stockage, SDX fournit un ensemble intégré de technologies de sécurité et de gouvernance basées sur des métadonnées qui fournissent un contexte persistant à travers toutes les capacités analytiques de la plate-forme de données mutualisée.
- CDP comprend une large sélection d'applications analytiques qui s'exécutent. sur des clusters de calcul, y compris Spark, Hive, Impala, Hbase, MapReduce et Solr, pour n'en nommer que quelques-uns.
- CDP comprend plusieurs options de stockage, y compris HDFS traditionnel et Apache Ozone, un magasin d'objets évolutif, redondant et distribué pour Hadoop.
Et tout fonctionne sur la dernière infrastructure de serveur, de stockage et de mise en réseau Dell EMC qui a été conçue et optimisée en tant que solution intégrée complète, PowerEdge, PowerScale et PowerSwitch pour Cloudera Data Platform.
Quoi de neuf dans cette version
En plus de toutes les fonctionnalités de base de Cloudera Data Platform, CDP Private Cloud Base 7.1.7 introduit :
- Prise en charge de Serveurs Dell EMC PowerEdge avec processeurs évolutifs Intel® Xeon® de 3e génération, avec des configurations aux performances optimisées conçues et validées pour les nœuds d'infrastructure et de travail.
- Prise en charge du stockage Dell EMC PowerScale, une solution de stockage en réseau évolutive hautement flexible qui peut être utilisé comme stockage HDFS principal et qui permet d'adapter indépendamment les capacités de calcul et de stockage.
- Accès à toutes les nouvelles fonctionnalités et capacités du logiciel CDP Private Cloud Base 7.1.7, y compris
- Améliorations à Cloudera Manager, y compris des correctifs de sécurité pour plusieurs bibliothèques intégrées, ce qui en fait la version la plus sécurisée de CDP PvC Base à ce jour.
- Mises à jour SDX pour une meilleure gouvernance et sécurité de la plate-forme et des données.
- Fonctionnalités Ozone pour une haute disponibilité complète.
- Améliorations du streaming, notamment l'intégration entre Kafka et Atlas pour une meilleure évolutivité.
- Et plus, avec des informations sur toutes les nouvelles fonctionnalités de la version 7.1.7 situées ici.
- Des améliorations de mise à niveau importantes sont présentes dans cette version, pour aider les clients avec leur migration vers CDP Private Cloud Base, y compris :
- Les mises à niveau sur place sont disponibles pour toutes les versions antérieures de CDH et HDP prises en charge, y compris CDH 6.1, 6.2 et 6.3, et HDP 2.6 et 3.1, sans avoir à créer un nouveau groupe.
- Des procédures de restauration documentées sont disponibles pour CDH 6.x et pour HDP 3.1.
- Un guide complémentaire de mise à niveau est disponible pour compléter la documentation de mise à niveau qui vous guide tout au long de votre mise à niveau périple. Vous pouvez voir le compagnon de mise à niveau ici.
Pourquoi c'est important
La base de cloud privé CDP est importante pour trois raisons principales. Premièrement, pour les nouveaux déploiements, CDP Private Cloud Base est une instance autonome complète de Cloudera Data Platform qui fournit de puissantes charges de travail analytiques, transactionnelles et d'apprentissage automatique avec un calcul et un stockage évolutifs. Il contient les dernières et les meilleures fonctionnalités des héritages Hortonworks et Cloudera, et bien plus encore, et constitue donc le meilleur choix pour une plate-forme de données complète.
Deuxièmement, pour les mises à niveau des environnements CDH et HDP hérités, CDP Private Cloud La base est le point final ultime. Cette version répond à la vision de Cloudera pour les mises à niveau sur place de toutes les versions CDH et HDP prises en charge.
Et troisièmement, CDP Private Cloud Base est la base de la dernière innovation de Cloudera, CPD Private Cloud Data Services. Ensemble, Base et Data Services forment l'offre complète de CDP Private Cloud. Les services de données incluent un ensemble d'expériences d'analyse en libre-service conteneurisées qui s'exécutent sur Kubernetes, notamment les services d'ingénierie de données, d'entrepôt de données et d'apprentissage automatique. Les services de données de cloud privé CDP sont disponibles dès aujourd'hui auprès de Cloudera et seront bientôt disponibles dans le cadre d'une conception validée par Dell Technologies pour l'analyse.
Toute la documentation, y compris le Livre blanc, Guide de conception et solution briefpeuvent être consultés sur Dell Technologies Info Hub for Analytics. Des informations sur toutes les solutions d'analyse de Dell Technologies sont disponibles sur notre page Solutions d'analyse .
Source link