Fermer

février 5, 2023

Une approche agile de la Data Science

Une approche agile de la Data Science


Adopter une approche agile de la science des données permet de faire face aux environnements en évolution rapide, à l’incertitude, aux solutions complexes, aux technologies émergentes et aux exigences ambiguës inhérentes à ces projets. Dans Méthodologie OpenText Data Science Partie 1nous avons exploré les éléments agiles clés pour réduire les risques et obtenir des résultats rapides dans des scénarios imprévisibles et complexes en livrant tôt et fréquemment des produits de grande valeur et en examinant régulièrement les résultats avec le client.

La méthodologie OpenText Data Science développe l’approche Agile, en mettant l’accent sur six domaines ou phases clés :

  • Compréhension commerciale
  • Compréhension des données
  • Préparation des données
  • La modélisation
  • Évaluation
  • Déploiement

1. Compréhension commerciale

À quel problème ou question voulons-nous répondre avec les données ?

Cette première phase consiste à comprendre le contexte et les objectifs commerciaux du projet. Il est important, à ce stade, d’avoir une idée de ce à quoi pourrait ressembler le succès et de le définir comme critère pour toutes les autres phases. Les activités comprendront l’inventaire des ressources et des exigences, les hypothèses, les contraintes, les risques, les imprévus, la terminologie, les coûts et les avantages. Après avoir évalué la situation, un plan de projet peut être produit, un objectif d’exploration de données défini et les experts en la matière réunis (rassembler les bonnes personnes).

2. Compréhension des données

Quelles données avons-nous qui pourraient répondre à nos questions?

Chaque projet de science des données comporte trois ingrédients indispensables : données + personnes + technologie. Dans cette phase, l’accent est mis sur le premier ingrédient, les données. Les activités comprendront la collecte de données, leur description, leur exploration et la vérification de leur qualité. Après avoir évalué et construit une compréhension des ensembles de données initiaux, le plan de projet peut être mis à jour avec des tâches de préparation des données ou même des tâches pour rechercher des données supplémentaires.

3. Préparation des données

Que devons-nous faire pour préparer les données pour l’exploration ?

Cette phase consiste à tirer le meilleur parti des données dont vous disposez. Parfois, cela signifie le numériser, l’OCR ou le pré-traiter d’autres manières afin qu’il puisse être utilisé dans la prochaine phase de modélisation. Les activités comprendront :

  • Sélection des données – décider de la justification de leur inclusion ou de leur exclusion
  • Nettoyer les données – définir les règles pour les nettoyer et préparer un rapport si nécessaire
  • Construire des données – à partir d’attributs dérivés ou générer des enregistrements
  • Intégration des données – fusion des données
  • Formatage des données – reformatage

4. Modélisation

Comment pouvons-nous imiter ou améliorer les connaissances ou les actions humaines grâce à la technologie ?

Cette phase s’applique à tout type de science des données, qu’il s’agisse de données structurées ou de données extraites de texte. Parallèlement aux choix technologiques, sélectionnez les techniques de modélisation, testez les conceptions, faites évoluer votre modèle et évaluez-le par rapport aux critères et aux objectifs d’exploration de données établis lors de la phase de compréhension de l’entreprise.

5. Évaluation

Quelles nouvelles informations savons-nous maintenant?

Une approche agile appelle à livrer des produits de grande valeur tôt et fréquemment. Au cours de cette phase, une évaluation des résultats de l’exploration de données concernant les critères de réussite commerciale est effectuée par l’équipe de développement. Essentiellement, le modèle est testé pour valider ses performances par rapport au problème défini dans le phase de compréhension de l’entreprise. Un examen des modèles et processus approuvés fournit une liste des prochaines actions et décisions au client pour obtenir des commentaires et même une utilisation initiale pour générer de la valeur commerciale.

6. Déploiement

Quelles actions devrions-nous déclencher avec les nouvelles informations ? Qu’est-ce qui a besoin d’une validation humaine ?

Avec l’approbation du client, cette phase permet la livraison de la valeur initiale du produit, et les activités comprendront :

  • Plan de déploiement
  • Surveillance et entretien
  • Produire le rapport final et la présentation
  • Revoir le projet

Atelier de stratégie cognitive

La différence de la science des données OpenText

Un véritable facteur de différenciation avec les services professionnels d’OpenText dans le domaine de l’IA, c’est qu’il abrite des scientifiques des données et des analystes cognitifs qui ne sont pas seulement des experts dans leur domaine – (avec des doctorats et des décennies d’expérience) – mais ils sont également véritablement passionnés pour aider les gens à comprendre et exploitez le potentiel de leurs données.

Avant de se lancer dans un projet, OpenText propose un atelier de stratégie cognitive conçu pour les responsables informatiques, les analystes commerciaux et les propriétaires de données. Il s’agit d’un atelier stratégique de quatre jours adapté aux besoins d’une organisation. OpenText fournit des conseils et des orientations basés sur les meilleures pratiques pour la mise en œuvre d’un projet d’IA utilisant Magellan afin de tirer le meilleur parti des données structurées et non structurées.

Par-dessus tout, rappelez-vous que chaque projet de science des données comporte trois ingrédients indispensables : données + personnes + technologie. L’art consiste à réunir ces trois éléments grâce à une méthodologie de science des données.

En savoir plus sur le Atelier de stratégie cognitive ou notre Services d’IA et d’analysealternativement contacter l’équipe.




Source link