The Right Stuff : le rôle des MLOps dans le succès de l’IA

Les grandes équipes intègrent une variété de compétences. Par exemple, une équipe de football composée de 11 quarts-arrières serait écrasée dans un match contre des joueurs de ligne talentueux, des porteurs de ballon et des receveurs. Ce n’est pas différent lors de la constitution d’une équipe pour un projet d’IA d’entreprise ; vous ne pouvez pas simplement jeter un groupe de scientifiques des données dans une pièce et vous attendre à ce qu’ils proposent un projet générateur de revenus ou améliorant l’efficacité sans le soutien d’autres membres de l’entreprise.
Fait intéressant, de nombreuses entreprises font exactement cela, créant une déconnexion entre les équipes de science des données et l’IT/DevOps en matière de développement de l’IA. Cet écart est une raison importante pour laquelle les projets pilotes d’IA échouent.
« Les projets d’IA sont un sport d’équipe et devraient inclure une équipe multidisciplinaire couvrant les analystes commerciaux, l’ingénierie des données, la science des données, le développement d’applications, les opérations et la sécurité informatiques », selon Moor Insights & Strategy dans un rapport de septembre 2021 intitulé « Hybrid Cloud est la bonne infrastructure pour faire évoluer l’IA d’entreprise. »
Le plus grand fossé entre les scientifiques des données et l’informatique concerne souvent les outils nécessaires pour développer des modèles d’IA.
« De nombreuses organisations informatiques essaient de créer une solution unique et performante qui répond à tous les besoins », déclare Michael Balint, architecte produit principal chez NVIDIA. Par exemple, beaucoup préfèrent développer avec des frameworks d’apprentissage en profondeur tels que PyTorch sur un système dédié, tandis que d’autres planifient leur travail en utilisant Slurm ou Kubeflow. Le service informatique se demande souvent comment tout regrouper en une seule solution. »
Pourtant, cela peut être un désastre lorsqu’il s’agit de projets d’IA, prévient Balint. « Il s’agit d’un domaine tellement naissant que si vous êtes dans l’informatique et que vous essayez d’appuyer sur la gâchette d’une solution, vous risquez de manquer des fonctionnalités dont un data scientist ou un ingénieur de données pourrait avoir besoin pour faire son travail. Les scientifiques des données aimeraient vraiment construire des modèles et faire de la véritable science des données de base. Ils sont frustrés lorsqu’ils n’ont pas les outils pour le faire, et le blâme est mis sur l’informatique.
MLOps à la rescousse
La meilleure approche consiste à faire en sorte que l’informatique travaille avec les groupes de science des données pour combler l’écart grâce à des processus et des outils tels que les MLOps. Ceux-ci peuvent fournir aux entreprises une gouvernance, une sécurité et une collaboration grâce à des fonctionnalités telles que le suivi et la répétabilité. Les plates-formes MLOps peuvent orchestrer la collecte d’artefacts, l’infrastructure de calcul et les processus nécessaires pour déployer et maintenir des modèles basés sur l’IA. De nombreux systèmes MLOps peuvent également évaluer la précision des modèles afin de se recycler et de se redéployer si nécessaire.
« Les organisations peuvent augmenter le pourcentage de modèles déployés avec succès en production en mettant en œuvre des outils MLOps, qui aident à gérer les utilisateurs de la science des données, les données, les versions de modèles et les expériences », déclare Moor Insights. « L’outillage doit également permettre aux équipes informatiques de gérer le cycle développement-déploiement avec la même rigueur DevOps que les applications d’entreprise traditionnelles. »
Cette approche peut aider les entreprises à combler le fossé entre les données et l’informatique.
« Il y a quelques années, l’accent était mis sur les ingénieurs d’apprentissage en profondeur et les scientifiques des données en tant que héros de l’industrie », explique Balint. « Je pense que les héros méconnus sont les ingénieurs DevOps et MLOps qui siègent dans le groupe informatique, car vous devez créer les bonnes solutions et piles pour que tout le monde puisse faire son travail. Si vous n’avez pas cela, vous ne pouvez pas vous déplacer très rapidement.
Aller ici pour obtenir plus d’informations sur le développement de modèles d’IA à l’aide du logiciel DGXTM-Ready sur les systèmes NVIDIA DGX, alimenté par les GPU DGX A100 Tensor core et les processeurs AMD EPYCTM.
Source link