Qu’est-ce qui se dresse entre l’informatique et le succès commercial ? Complexité des données

Par George Trujillo, stratège principal des données, DataStax
« De l’eau, de l’eau partout, et toutes les planches ont rétréci ;
De l’eau, de l’eau partout, ni aucune goutte à boire.
– « The Rime of the Ancient Mariner » de Samuel Taylor Coleridge
Toute stratégie de gestion des données d’entreprise doit commencer par s’attaquer au gorille de 800 livres dans le coin : le « fossé d’innovation » qui existe entre les équipes informatiques et commerciales. C’est un phénomène courant dans tous les types d’entreprises, et il est difficile de lutter contre le sol. Les équipes informatiques sont aux prises avec un volume, une vitesse et une variété de données en constante augmentation, qui affluent de sources telles que les applications et les appareils IoT. Dans le même temps, les équipes commerciales ne peuvent pas accéder, comprendre, faire confiance et travailler avec les données qui comptent le plus pour elles. Cette rareté de données de qualité pourrait donner l’impression de mourir de soif au milieu de l’océan.
Ici, je vais discuter de la cause la plus courante du déficit d’innovation et de la manière de le combler.
La complexité est l’ennemie de l’innovation
La plupart des organisations (81 %) n’ont pas de stratégie de données d’entreprise qui leur permette de tirer pleinement parti de leurs actifs de données, selon Accenture. Le financement informatique est peut-être en hausse, mais le retour sur investissement de l’entreprise grâce aux investissements technologiques n’est pas aussi élevé qu’il devrait l’être. Il existe souvent une grande différence d’attente entre l’objectif d’être axé sur les données et la transformation de l’entreprise créée par les données. Une pile technologique de données en temps réel doit réduire cet écart d’innovation pour l’entreprise.

DataStax
Les analystes et les scientifiques des données ont besoin de flexibilité lorsqu’ils travaillent avec des données ; l’expérimentation alimente le développement de modèles d’analyse et d’apprentissage automatique. Si les données sont difficiles à travailler, l’expérimentation ralentit, et par conséquent, l’innovation aussi. La plupart des entreprises exploitent diverses plates-formes d’ingestion de données, de nombreux flux de données de messagerie et de mise en file d’attente, ainsi que des bases de données de plusieurs fournisseurs. L’interopérabilité des données entre divers éléments d’un écosystème de données détermine l’efficacité de la création de valeur commerciale avec les données.

DataStax
Ces systèmes disparates créent souvent un niveau de complexité qui a un impact direct sur la vitesse à laquelle les entreprises peuvent fournir des informations. Cela a également un impact sur la sécurité des données, la gouvernance et la gestion du changement. (En savoir plus sur la façon de remédier à la complexité des données dans le livre électronique DataStax, Le guide du CIO pour briser les silos de données). Les organisations ne peuvent ni acheter ni louer pour sortir de cette complexité. Une stratégie d’entreprise holistique pour concevoir et aligner les solutions technologiques vers une standardisation accrue est le meilleur moyen de sortir de cette jungle de la complexité des données. Ou, pour citer Jeanne Ross du MIT« Un succès durable nécessite de simplifier la complexité sans valeur ajoutée. »
Le mauvais chemin : écosystèmes de données cloisonnés
Souvent, les écosystèmes de données d’entreprise sont construits avec un état d’esprit trop étroit. De nombreuses organisations hébergent leurs données dans divers « fiefs » ou silos. Le plus souvent, ces architectures de données fragmentaires surgissent au fil du temps alors que les organisations, dans une tentative d’exploiter la valeur de leurs données, investissent dans une variété de solutions technologiques ponctuelles. Cela aurait pu fonctionner pour une équipe, un projet ou une application, mais le résultat final de cet effort était de verrouiller les données dans une variété de silos à travers l’organisation.
La transformation numérique a effectivement contribué à cette complexité. À mesure que les services et les applications devenaient de plus en plus découplés et affinés (pensez aux microservices), ils se sont multipliés. Il en va de même pour les bases de données opérationnelles et les couches d’abstraction qui les prennent en charge. La plupart des grandes entreprises prennent en charge des dizaines de bases de données NoSQL et SQL, pour la plupart propriétaires et hautement disloquées. Cela se traduit par un grand nombre de licences coûteuses et de nombreuses ressources de maintenance opérationnelle.
Alors que la notion de considérer les données comme une collection de silos est évidemment obsolète, j’ai rencontré de nombreuses organisations qui ont fait l’erreur d’essayer d’améliorer les architectures de données sur une base « silo par silo ».
En effet, cela crée des poches de technologies individuelles – et des équipes de soutien pour les accompagner – qui parlent des langues différentes.

DataStax
Une vision globale de l’écosystème
La réduction du nombre de « langues » différentes réduit le temps de traduction lors de l’intégration des données. L’objectif est de réduire la complexité, afin que les changements aient un effet composé positif sur l’ensemble de l’écosystème, et non sur un seul segment particulier de l’architecture. Pour améliorer l’efficacité d’un écosystème, il est essentiel de prendre du recul et d’avoir une vue globale du flux de données à travers l’écosystème.

DataStax
Les données se déplacent dans un écosystème de données via des applications, des flux de données, des bases de données et des plates-formes analytiques. Plus les données peuvent circuler facilement dans l’écosystème, plus l’intégration et la corrélation des données pour l’analyse deviennent fluides. Il s’agit de transmettre les bonnes données aux bonnes personnes au bon moment, et cela ne peut se produire que si une organisation réduit la complexité. Cela augmente la quantité de données pouvant être utilisées pour des informations commerciales et contribue grandement à réduire la situation de pénurie de données.
Innovation aux points d’intégration
Il est également important de considérer où l’innovation se produit avec des données en temps réel ; cela se produit souvent aux points d’intégration de données. Ces points d’intégration de données (où, par exemple, les données sont combinées à partir de flux de clics, de programmes de fidélité et de mises à jour d’expédition) peuvent devenir des points de friction entre l’informatique et l’entreprise. Les changements à ces points d’intégration qui résultent d’une demande commerciale de nouvelles informations peuvent être difficiles et longs à effectuer. Lorsque les données sont diffusées à partir de diverses technologies (Apache Kafka, Apache Pulsar, JMS ou Qlik, par exemple), les équipes qui gèrent différentes technologies avec des compétences différentes doivent travailler ensemble. Cela peut prendre des semaines, voire des mois, pour apporter des changements permettant à l’entreprise de se fier à la qualité des données.

DataStax
Je donnéesnnovation dans les métiers
Les secteurs d’activité comprennent les données de leur domaine. Ils réalisent également qu’il existe des données utiles qui résident dans d’autres domaines d’activité auxquels ils souhaitent s’intégrer. Les secteurs d’activité doivent être habilités à accéder facilement aux données en temps réel en aval afin qu’ils puissent innover avec eux et ne pas dépendre des équipes technologiques.

DataStax
Le défi est que les développeurs travaillant dans des secteurs d’activité particuliers n’ont souvent pas l’expertise technique dans les technologies de streaming/file d’attente. Un moyen clé de résoudre ce problème consiste à créer un écosystème de données en temps réel qui fonctionne juste: il permet aux développeurs d’innover facilement avec des données de n’importe où dans l’organisation et contribue grandement à accélérer l’innovation commerciale.
Sélection d’une pile technologique de données en temps réel
Les applications, les sources de diffusion externes et les bases de données génèrent des flux de données. Plus tous ces éléments peuvent être intégrés facilement, plus les changements de données pour les informations peuvent être exécutés rapidement. Pour soutenir la normalisation et aider à combler le fossé de l’innovation, les plates-formes de messagerie et de mise en file d’attente doivent gérer différents types de sources de données (mobile, IoT et bases de données, par exemple) et accepter les flux de données provenant de différentes plates-formes d’ingestion.
De même, une base de données doit prendre en charge une activité de données à grande vitesse et plusieurs modèles de données. Ce type d’alignement horizontal des flux de données – entre les applications, les sources de données externes, les bases de données, les caches mémoire, les tableaux de bord et les plates-formes analytiques – est un élément clé d’une pile technologique de données en temps réel moderne. L’alignement vertical est également important : la possibilité de se déployer facilement sur site, dans le cloud, dans plusieurs régions et sur plusieurs clouds.
N’oubliez pas que l’objectif est de réduire la complexité du nombre de plates-formes technologiques, et non de les augmenter. Ajouter plus de logiciels pour migrer vers le cloud, par exemple, est un anti-modèle pour se déplacer avec rapidité et agilité. Si les applications doivent être déplacées, il en va de même pour leur écosystème et les messageries/files d’attente et bases de données associées auxquelles elles envoient des données.
Changer l’état d’esprit de la complexité
Toute stratégie de gestion des données en temps réel doit réduire l’état d’esprit de la complexité, résoudre les points de friction entre l’informatique et l’entreprise et donner aux secteurs d’activité, aux analystes et aux scientifiques des données des données faciles à utiliser. La stratégie commerciale émerge plus facilement des données lorsqu’un écosystème de données est vu de manière holistique et dynamique, par opposition à une vue statique et cloisonnée. Une vue d’ensemble du parc de données d’une organisation (et d’une pile de données en temps réel pour le prendre en charge) montre comment l’écart d’innovation qui apparaît si souvent entre l’informatique et l’entreprise est comblé, et comment la soif d’accéder aux données pour l’innovation est satisfaite .
En savoir plus sur DataStax ici
À propos de George Trujillo :
George Trujillo est stratège principal des données chez DataStax. Auparavant, il a constitué des équipes hautement performantes pour des initiatives axées sur la valeur des données dans des organisations telles que Charles Schwab, Overstock et VMware. George travaille avec des CDO et des responsables de données sur l’évolution continue des stratégies de données en temps réel pour leur écosystème de données d’entreprise.
Source link