juin 14, 2018

Le défi de l'étalement des données: accessibilité et qualité

L'ère de l'information a cédé la place à l'ère des données: chaque jour, des millions d'utilisateurs, d'entreprises et de gouvernements génèrent une quantité colossale de données.

Pour compliquer davantage les choses, cette abondance de données n'est pas égale. Un petit pourcentage des données disponibles est structuré, telles que les données sur les ventes, les données clients et les données de base, et est standardisé dans un format qui facilite la recherche et l'analyse rapide. La plupart des volumes de données d'aujourd'hui proviennent d'informations précédemment inexploitées, semi-structurées et non structurées contenues dans des entrepôts de données cloud et périphériques qui codent des informations importantes que les entreprises peuvent utiliser pour rester compétitives. De loin, le plus grand volume de données est produit par les images et la vidéo, qui contiennent une quantité massive d'informations. Cependant, les données créées à partir des machines et de l'utilisation des applications ne sont pas loin derrière.

Toutes les applications cloud ne sont pas conçues pour abandonner facilement leurs données, créant des îlots d'isolation des données qui privent les travailleurs du savoir. Il peut s'agir d'applications classiques telles que HR ou CRM, qui sont désormais construites avec des magasins de valeurs de clés distribuées et des bases de données OLTP partagées, rendant l'accès SQL classique impossible. Même les applications client développées en interne sont souvent construites sur des magasins non SQL, ce qui accélère le développement d'applications, mais à un coût. De nos jours, les applications personnalisées développées en interne ne sont financées que pour créer de la valeur commerciale et non pour garantir que les données sous-jacentes sont facilement disponibles pour être harmonisées avec d'autres informations sur l'entreprise

une attente irréaliste que les données provenant de ces types d'applications et de canaux externes soient facilement accessibles pour l'analyse et la production de rapports. Cependant, il est loin d'être facile de bousculer les différents types de données non standardisées à partir du nuage et d'autres canaux de données externes. Comme les informations non structurées continuent de proliférer rapidement, de plus en plus d'entreprises luttent pour faire face à cette prolifération. Les applications cloud d'entreprise ne veulent pas faciliter l'exportation de données, car cela crée une «ligne» d'où leur territoire se termine et réduit leurs opportunités de créer et de facturer des services analytiques. Cela amène les clients à se plaindre que leur compréhension de leurs activités diminue, en fait.
Les forces responsables de l'étalement des données sont complexes et multiformes. Alors que l'entropie des données englobe la difficulté de localiser des sources de données disparates, comme discuté dans mon précédent blog l'étalement des données met l'accent sur l'accessibilité et la qualité de ces données. C'est le contraire de la promesse de la transformation numérique, et pourtant c'est exactement ce qui s'est passé lorsque les entreprises ont adopté les applications cloud, IoT, et ont rapidement développé des applications internes. Les entreprises ont besoin d'une solution qui offre des adaptateurs à toutes les sources de données et à tous les types de données, afin de pouvoir accéder, interroger et traiter les données de manière efficace et sécurisée, fiable et régie.

19659005] L'étalement des données présente également des défis importants en matière de modélisation statistique. Les entreprises voient la nécessité de devenir des entreprises intelligentes, où les décisions simples sont automatisées pour permettre aux ressources de se concentrer sur des problèmes d'ordre supérieur. Ces sources de données disparates et apparemment incompatibles doivent être combinées, nettoyées, utilisées pour générer des modèles statistiques et déployées pour l'automatisation des processus métier. C'est un énorme défi que les entreprises commencent à peine à comprendre, et encore moins à négocier.

La plupart des entreprises déclarent avoir l'intention de conserver des données critiques sur site ou dans des clouds privés. Mais les plus gros volumes de données nécessaires pour construire des modèles statistiques pour l'analyse et la notation sont souvent stockés dans des applications cloud et cloud publiques. Les entreprises ont besoin d'outils pour planifier et orchestrer l'extraction de données à partir de bases de données cloud et de données de bord, extraire et traiter les données pertinentes, former des modèles, renvoyer le modèle au système approprié, puis mettre hors service ces ressources temporaires. Tout ce traitement complexe n'est que la première étape. Les entreprises ont également besoin d'outils de test de modèles et de tableaux de bord pour suivre la qualité du modèle. et, plus important encore, ils doivent maintenir des pistes de vérification de ces processus pour assurer une gouvernance adéquate.
La gestion du cycle de vie des données est une autre question qui se pose lorsque l'on examine la façon d'aborder l'étalement des données. En règle générale, à mesure que les données vieillissent, elles sont moins souvent examinées, mais certaines données restent cruciales quel que soit leur âge. Un bon exemple est les données de base. Les données sont un atout, et leur valeur et leur qualité doivent être suivies au fil du temps. La fréquence d'accès est un proxy essentiel pour la valeur, mais il en existe d'autres, et ces indicateurs doivent être pris en compte pour comprendre quelles données doivent être protégées et stockées dans des magasins dynamiques, comme SAP HANA, et quelles données peuvent être conservées dans d'autres solutions. Les données doivent être gérées tout au long de leur cycle de vie et déplacées vers des emplacements appropriés en termes de coûts et de sécurité, à mesure que leur valeur diminue. Par pays, les données doivent être archivées, et finalement détruites, à la fois pour respecter la réglementation et limiter l'exposition juridique de l'entreprise.
L'ère des données est imminente et l'étalement des données est là pour durer. Les entreprises ont besoin de solutions agiles pour les aider à relever les défis posés par ces solutions qui permettront aux entreprises de réaffirmer le contrôle de leurs données et d'utiliser les données dont elles ont besoin, quand elles en ont besoin et où elles en ont besoin.
Nous avons continué à préparer le terrain pour les besoins actuels de gestion de données d'entreprise.
Cet article a été publié à l'origine sur le blog SAP HANA et est republié avec sa permission.
<! – Commentaires ->

Blog ARC Optimizer

juin 14, 2018

Le défi de l'étalement des données: accessibilité et qualité

Articles similaires

Blog ARC Optimizer

Partager :

Articles similaires