La vision par ordinateur est amorcée pour la valeur commerciale

Au cours des dernières années, les applications de vision par ordinateur sont devenues omniprésentes. Des téléphones qui reconnaissent les visages de leurs utilisateurs aux voitures qui se conduisent elles-mêmes, en passant par les satellites qui suivent les mouvements des navires, la valeur de la vision par ordinateur n’a jamais été claire.
Mais les pénuries de matériel et les interruptions de travail dans le sillage de la pandémie mettent à l’épreuve la capacité des entreprises à tenir la promesse de la vision par ordinateur, même si la pandémie elle-même a accéléré le potentiel de ses cas d’utilisation.
Voici un aperçu de la façon dont les entreprises de divers secteurs déploient la vision par ordinateur pour améliorer et optimiser les processus commerciaux clés, de la distribution au détail aux diagnostics de soins de santé.
Qu’est-ce que la vision par ordinateur ?
La vision par ordinateur est un domaine de l’intelligence artificielle qui se concentre sur le traitement d’images et de vidéos pour en extraire des informations significatives. Des exemples de vision par ordinateur en action incluent la reconnaissance optique de caractères, la reconnaissance d’images, la reconnaissance de formes, la reconnaissance faciale et la détection et la classification d’objets.
Les industries qui font un usage intensif de la vision par ordinateur comprennent la fabrication, la santé, l’automobile, l’agriculture, la logistique et la chaîne d’approvisionnement. Dans les entreprises, les principaux moteurs du déploiement de la vision par ordinateur incluent l’automatisation, l’amélioration des processus et la productivité, ainsi que la conformité réglementaire et la sécurité.
« Le marché croît si vite qu’il est difficile de garder un œil dessus », déclare l’analyste d’IDC Matt Arcaro, ajoutant que la pandémie a accéléré l’adoption de la vision par ordinateur – par exemple, pour surveiller l’occupation afin d’assurer une distanciation sociale ou de suivre comment beaucoup de gens utilisaient le transport en commun.
« Parce qu’il y a beaucoup de caméras CCTV en place, c’est une mise à niveau élégante » pour incorporer la vision par ordinateur, dit Arcaro. « Et, dans de nombreux cas, en raison de mandats gouvernementaux ou de choix organisationnels, les dollars d’investissement ont été là. »
Selon IDCle marché mondial total des technologies de vision par ordinateur atteindra 2,1 milliards de dollars cette année, passant de 760 millions de dollars en 2020, avec un taux de croissance annuel composé de 57 % prévu jusqu’en 2025, à une valeur marchande totale de 7,2 milliards de dollars.
La majeure partie de ce marché est actuellement sur site, mais IDC s’attend à ce que les déploiements de cloud public représentent 48 % des dépenses de vision par ordinateur d’ici 2025.
Mise à l’échelle et accélération de l’exécution et de la livraison au détail
Le secteur de la vente au détail a connu des perturbations dramatiques pendant la pandémie, les clients déplaçant une plus grande partie de leurs achats en ligne et passant de plus en plus à la livraison à domicile.
Walmart, par exemple, a signalé que le le nombre d’acheteurs se faisant livrer leurs courses a été multiplié par six par rapport à avant la pandémie. Pour relever le défi, la chaîne multinationale d’hypermarchés a augmenté sa capacité de ramassage et de livraison de 20 % l’an dernier et prévoit de l’augmenter encore de 35 % cette année.
Pour y parvenir, Walmart investit dans plusieurs catégories de technologies équipées de vision par ordinateur, notamment les drones et les véhicules autonomes. La la société a annoncé en juillet dernier ses plans déployer les robots de Symbotic dans 25 de ses 42 centres de distribution régionaux. Les robots utilisent la vision par ordinateur, entre autres technologies d’intelligence artificielle, pour déplacer le fret dans les entrepôts.
Pendant ce temps, la chaîne de supermarchés américaine Kroger a investi dans des micro-centres de distribution – des entrepôts de distribution à petite échelle et fortement automatisés situés à proximité de l’endroit où vivent les clients. L’objectif est de livrer les courses aux clients en aussi peu que 30 minutes, selon l’entreprise. Depuis l’été dernier, Kroger a ouvert des installations en Floride, en Alabama, au Texas, en Californie, en Ohio et en Géorgie, et prévoit d’ouvrir 17 autres installations, y compris des hubs et des rayons, au cours des 24 prochains mois.
Sur un site central, plus de 1 000 bots « tournent autour de grilles 3D géantes, orchestrées par des systèmes propriétaires de contrôle du trafic aérien », selon l’entreprise. Au lieu de déplacer des palettes entières de produits, comme cela se produit dans un centre de distribution régional, les robots récupèrent ici les articles individuels. La vision par ordinateur est utilisée pour trier et emballer les articles afin que, par exemple, les articles lourds soient au fond et que les sacs soient uniformément pesés.
La société de vente au détail à la demande Fabric, spécialisée dans les micro-centres de distribution destinés aux détaillants qui ne peuvent pas construire le leur, utilise largement l’automatisation dans ses installations, déclare le cofondateur Ori Avraham. « Nous utilisons la vision par ordinateur comme une fonctionnalité clé de notre solution robotique », déclare-t-il. « Par exemple, la navigation précise des robots sur le sol est basée sur l’analyse visuelle des autocollants de sol. Ce processus se produit en temps réel dans le cadre de la navigation du robot. »
Les bras de prélèvement robotisés utilisent également la vision par ordinateur, dit-il. « Pour cela, nous utilisons un algorithme de segmentation et de classification pour nous permettre de sélectionner et de placer des éléments. Ces deux capacités sont cruciales pour notre capacité à exploiter avec succès nos micro-centres de distribution. »
Le mois dernier, Fabric a ouvert un nouveau centre de micro-réalisation à Dallas, s’ajoutant à ses opérations existantes à New York ; Washington DC; et Tel-Aviv. Il a des partenariats avec Walmart, Instacart et FreshDirect et prévoit de doubler son réseau de micro-centres de distribution d’ici la fin de l’année.
Rationalisation et amélioration des processus de fabrication
La fabrication est une autre industrie révolutionnée par la vision par ordinateur, qui est largement utilisée sur les chaînes de production pour inspecter les produits, automatiser les processus et optimiser la productivité.
Mike Griffin, scientifique en chef des données chez Insight, une société de conseil en technologie basée à Tempe, en Arizona, a travaillé avec plusieurs clients industriels sur des projets de vision par ordinateur. Un partenariat consistait à développer un système dans lequel un appareil portatif pourrait être utilisé pour prendre une photo d’un bac de produits et fournir automatiquement un décompte du nombre de produits dans le bac.
« [The client] voulait être en mesure d’embaucher des personnes handicapées pour compter », dit Griffin. « Cela ressemble à une tâche facile [system to develop]mais le défi est que l’application de vision doit faire plus qu’interpréter ce qu’elle peut voir, mais elle doit aussi interrompre ce qu’elle ne peut pas voir.
Les produits peuvent être empilés les uns sur les autres, masquant ceux du bas. Le système de vision par ordinateur devait donc prendre une image en deux dimensions et la traduire en un modèle en trois dimensions. « Nous devions être précis à au moins 80 % sur notre inventaire, y compris les boîtes emballées dans du plastique transparent avec beaucoup de reflets dessus », explique Griffin.
Pour former le système, les employés se sont promenés avec des téléphones portables et ont pris des vidéos. Ensuite, un stagiaire a étiqueté manuellement 500 images extraites de ces vidéos, contenant 30 000 boîtes. Si peu d’images étaient nécessaires, car la vision par ordinateur est un domaine relativement mature de l’intelligence artificielle, avec de nombreux modèles pré-formés. Par exemple, pour créer un nouveau modèle pour un ensemble de données personnalisé, comme des boîtes, l’apprentissage par transfert est utilisé.
« Nous allons prendre un modèle qui a été formé sur des millions d’images de chats et de chiens et de voitures et ainsi de suite », explique Griffin. «Donc, une grande partie du travail a déjà été fait. Et puis nous pouvons ajouter nos 500 images de boîtes ou 1 000 images de pneus à ce modèle et le recycler avec cet ensemble d’images supplémentaires.
L’apprentissage par transfert permet une formation de modèle plus rapide, avec des ensembles de données plus petits, que ce qui serait autrement possible. « Vous pouvez également créer des données synthétiques », ajoute Griffin. « Par exemple, une entreprise de construction souhaitait identifier les dangers et ne disposait que de quelques centaines d’images de formation. Nous avons créé des images supplémentaires, en plaçant ces cônes de danger orange dans, par exemple, un champ ou un parking, pour augmenter leur ensemble d’images afin de renforcer cette formation.
Une autre utilisation innovante du traitement d’image dans la fabrication consiste à traduire les données de test en images, puis à utiliser l’apprentissage automatique sur les images générées.
« Les échecs de test peuvent être proches les uns des autres, mais il n’est pas évident qu’ils soient liés les uns aux autres jusqu’à ce que vous traduisiez ces données en images », déclare Griffin. « Ils sont proches les uns des autres dans l’espace de test, au lieu d’être proches les uns des autres dans l’espace physique. »
Améliorer le diagnostic médical
Dans les soins de santé, la vision par ordinateur est largement utilisée dans les diagnostics, comme dans l’interprétation d’images et de vidéos alimentée par l’IA. Il est également utilisé pour surveiller la sécurité des patients et pour améliorer les opérations de soins de santé, explique Tuong Nguyen, analyste chez Gartner.
« Le potentiel de la vision par ordinateur est énorme », dit-il. « Il s’agit essentiellement d’aider les machines à donner un sens au monde. Les applications sont infinies – vraiment, tout ce que vous devez voir. Le monde entier. »
Selon le quatrième enquête annuelle Optum sur l’IA dans les soins de santé, publié fin 2021, 98 % des organisations de santé ont déjà une stratégie d’IA ou prévoient d’en mettre en œuvre une, et 99 % des responsables de la santé pensent que l’IA peut être utilisée en toute confiance dans les soins de santé.
L’interprétation d’images médicales était l’un des trois principaux domaines cités par les répondants à l’enquête où l’IA peut être utilisée pour améliorer les résultats pour les patients. Les deux autres domaines, les soins virtuels aux patients et le diagnostic médical, sont également mûrs pour la vision par ordinateur.
Prenons, par exemple, la fibrose pulmonaire idiopathique, une maladie pulmonaire mortelle qui touche des centaines de milliers de personnes dans le monde. La maladie n’a pas de cause connue ni de remède et est très difficile à diagnostiquer. Aux États-Unis seulement, environ 40 000 personnes meurent de la maladie chaque année.
Selon PwC, il faut généralement plus de deux ans pour que la fibrose pulmonaire idiopathique soit diagnostiquée ; à ce moment-là, l’espérance de vie moyenne des personnes finalement diagnostiquées n’est que de trois à cinq ans.
L’Open Source Imaging Consortium Data Repository, soutenu par PwC et Microsoft, construit une plate-forme pour partager des données d’imagerie anonymisées afin d’aider au diagnostic de la maladie. D’ici la fin de cette année, l’organisation s’attend à avoir 15 000 scans dans sa base de données.
Grâce à l’IA et à l’apprentissage automatique, les médecins peuvent diagnostiquer la maladie plus rapidement et avec plus de précision, ce qui leur laisse plus de temps pour traiter les patients.
Et, à l’avenir, la même plateforme pourra également être utilisée pour d’autres maladies rares.
D’autres industries perturbées par la vision par ordinateur
Dans le secteur automobile, la vision par ordinateur est utilisée pour assister les conducteurs et pour surveiller les conducteurs afin de s’assurer qu’ils prêtent attention à la route. C’est également essentiel pour permettre aux voitures autonomes, un moteur de croissance majeur pour l’utilisation de la vision par ordinateur dans l’industrie automobile, déclare Aracaro d’IDC.
Mais il existe un autre marché clé pour la conduite autonome, et la vision par ordinateur en général, explique Arcaro : l’agriculture. « John Deere fait quelque chose de vraiment critique là-bas », dit-il, notant que la vision par ordinateur est également utilisée dans l’agriculture pour trier les produits, surveiller la santé des plantes et des animaux, et surveiller et gérer les actifs agricoles.
Dans le domaine de la cybersécurité, l’analyse d’images peut être utilisée pour lire des signatures ou repérer des sites Web de phishing conçus pour ressembler à de vrais sites Web, mais suffisamment différents pour échapper aux autres méthodes de détection.
Dans l’industrie hôtelière, la vision par ordinateur permet de suivre où les clients se rendent à bord des navires de croisière afin d’améliorer leur expérience.
Dans le secteur des services financiers, le traitement d’image capture les données des documents pour améliorer l’efficacité des processus métier.
« [Computer vision] couvre presque tous les secteurs », déclare Dinesh Batra, vice-président des données et de l’intelligence artificielle chez Capgemini Invent. « Il a été un outil extrêmement efficace pour les entreprises ces dernières années – et sa notoriété ne fera que s’accélérer. »
Avenir visiblement brillant
Et pourtant, malgré l’abondance de cas d’utilisation déjà employés, la vision par ordinateur a une marge de croissance importante.
« C’est encore tôt », déclare Nguyen de Gartner. « Je m’attends à voir plus de fournisseurs se présenter dans cet espace traitant de différents éléments de la chaîne de valeur. Il y a encore beaucoup d’opportunités à venir à mesure que la technologie s’améliore, devient plus abordable et plus accessible. Nous commencerons à le voir utilisé n’importe où et partout.
Ce n’est pas tout en douceur, cependant. Selon Gartner, les obstacles à l’adoption comprennent les pénuries de matériel et le manque de capacités de traitement. Dans certaines applications, il y a encore des problèmes de précision. Les systèmes de vision par ordinateur doivent également être intégrés dans les chaînes de production ainsi que dans les systèmes back-end, qui peuvent tous deux constituer un défi.
Ainsi, alors que le COVID-19 a augmenté la demande et le potentiel de vision par ordinateur dans les entreprises, les pénuries de matériel et les interruptions de travail qui en ont résulté à la suite de la pandémie ont jusqu’à présent rendu difficile pour de nombreuses entreprises de capitaliser sur la promesse de la technologie.
Mais à mesure que ces problèmes s’atténueront à l’avenir, les entreprises seront certainement prêtes à examiner de près la technologie.
Source link