Les responsables informatiques sont aujourd’hui confrontés à une question cruciale lorsqu’ils cherchent à déployer des charges de travail d’IA générative : est-il préférable pour mon entreprise d’exécuter des applications GenAI dans le cloud public ou sur site ?
La question suscite un débat animé des deux côtés de l’allée de l’hébergement. La plupart des responsables informatiques disent : « Cela dépend ». C’est vrai, mais cela demande aussi un peu de déballage.
Lorsque vous vous préparez à exécuter une nouvelle charge de travail, votre première envie peut être de la créer, de la tester et de la lancer dans un cloud public. Et pourquoi pas? Cette approche vous a probablement aidé à réduire le temps de déploiement et même à accélérer l’innovation.
Alors naturellement, lorsque vous envisagez de déployer un service GenAI, vous pourriez être tenté de le créer et de le lancer dans votre cloud public préféré. Vous pensez qu’il offrira une plus grande agilité et une plus grande rapidité que si vous le faisiez dans votre centre de données d’entreprise ou ailleurs.
Normalement, personne ne clignerait des yeux, ne vous blâmerait ou ne vous dirait de réfléchir à deux fois. Sauf que cette charge de travail est un peu différente.
Comme toujours, vous baserez votre décision de placement de la charge de travail sur la sécurité, les performances, la latence, le coût et d’autres variables, y compris la taille et la complexité du grand (ou petit) modèle de langage que vous prévoyez d’exécuter, ainsi que les environnements dans lesquels vous prévoyez de le déployer.
Pourtant, étant donné la myriade d’inconnues connues liées au déploiement des modèles GenAI – et le fait que la valeur que vous pouvez en tirer peut être intrinsèquement liée aux données de votre entreprise – votre capacité à contrôler cette nouvelle technologie pourrait l’emporter sur tous les autres facteurs.
Commencez votre aventure GenAI dans votre centre de données
Utiliser un produit disponible dans le commerce ou modèle open source à mesure que vous créez, testez et ajustez votre application sur site, vous pouvez apportez l’IA à vos donnéesvous offrant une plus grande efficacité de traitement tout en garder le contrôle de vos données.
Supposons que vous travailliez dans un secteur réglementé tel que la finance et que vous souhaitiez créer un service GenAI qui présente des informations sur les produits. Des mandats stricts en matière de sécurité et de confidentialité des données peuvent déterminer si et comment vous travaillez avec les services d’IA dans le cloud public. L’exécution d’une application GenAI sur site garantit que toutes les données restent dans l’environnement de l’organisation, réduisant ainsi le risque de violation de données tout en respectant les exigences réglementaires.
De plus, votre capacité à contrôler l’accès à l’instance GenAI pourrait contribuer à atténuer «IA de l’ombre» des préoccupations qui se multiplient au sein des organisations. Protéger votre propriété intellectuelle tout en empêchant le Far West est une bonne gouvernance.
Quelques scénarios nécessitent des interactions en temps réel avec le modèle d’IA, comme les chatbots qui soutiennent les ventes ou les clients. L’exécution du LLM sur site peut minimiser la latence puisque les données n’ont pas besoin de voyager vers des serveurs cloud distants et inversement. Cela peut entraîner des temps de réponse plus rapides tout en vous permettant de mieux surveiller la latence et le débit, ainsi que la précision de votre modèle. Cinquante-cinq pour cent des décideurs informatiques ont cité les performances comme l’une des principales raisons d’exécuter des charges de travail GenAI sur site, selon une étude. Enquête Dell des responsables informatiques.1
Les coûts présentent une autre variable délicate. L’exploitation d’une application GenAI dans le cloud public peut provoquer un choc à mesure que l’utilisation augmente ou si le la mise en œuvre n’est pas correctement étendue. Peut-être cherchez-vous à créer un environnement de programmation couplé dans lequel les humains écrivent du code pendant que GenAI le soumet à la sonnerie d’assurance qualité, ou vice versa.
Vous bénéficiez d’un meilleur contrôle sur la quantité de ressources que vous consommez sur site, ce qui vous aidera à réduire les coûts. Ce n’est pas une mince affaire, puisque 35 % des responsables informatiques interrogés par Dell ont cité le coût comme l’une des principales raisons du déploiement de leur charge de travail GenAI sur site.2
L’expérience cloud livrée sur site
Peut-être que votre parcours GenAI commence sur site, mais une fois que vous avez testé et formé votre application, en vérifiant ses performances, ses biais et d’autres problèmes, vous décidez de la lancer également dans un cloud public. Quatre-vingt-deux pour cent des décideurs informatiques ont indiqué qu’ils étaient plus intéressés par une approche sur site ou hybride pour créer leur solution GenAI, selon une étude. Enquête Dell Generative AI Pulse.3
Les modèles de cloud hybride offrent naturellement plus de choix. Dans cette optique, saviez-vous qu’il existe d’autres moyens de profiter d’une expérience cloud en interne ? Vous pouvez créer un pont entre votre parc sur site et vos cloud publics pour tirer le meilleur parti des deux environnements d’exploitation.
Les plates-formes cloud Dell APEX vous permettent de profitez de l’agilité et de la flexibilité des services cloud, avec la sécurité, les performances et le contrôle d’une solution sur site. Ces plates-formes, qui incluent Microsoft Azure, VMware et Red Hat OpenShift, offrent une expérience cloud unifiéevous permettant de vous procurer davantage d’infrastructures selon vos besoins tout en permettant un déploiement optimal des applications GenAI, telles que des assistants numériques et d’autres outils qui font apparaître des informations commerciales.
De cette façon, vous pouvez consacrer plus de temps et d’énergie à accélérer votre parcours GenAI pour obtenir des résultats commerciaux qui vous aideront à conduire la transformation numérique.
En savoir plus sur Plateformes cloud Dell APEX.
1Dell internal survey of IT decision makers, August 2023
2Dell internal survey of IT decision makers, August 2023
3Generative AI Pulse Survey, Dell Technologies, Sept. 2023
Source link