Démystifier l’IA – Couper le fil du battage médiatique

Depuis le lancement de ChatGPT le 30 novembre 2022, rien n’est plus pareil. De nos jours, les moteurs de recherche fonctionnent résumés utilisant l’IA à partir des résultats trouvés, les applications créent images et vidéos qui ressemblent à de l’art en quelques secondes, des groupes de musique inexistants à la mode Spotifytu peux programme vibrant en utilisant des agents de programmation, entre autres choses.
Cependant, vous êtes-vous déjà demandé ce que signifie le terme « intelligence artificielle » et ce qui se cache derrière un LLM ? Dans cet article, nous allons démystifier certains mythes liés au battage médiatique de l’IA, mais avant cela, nous devons connaître l’histoire et le fonctionnement des LLM.
Naissance du terme intelligence artificielle
Que cela nous plaise ou non, l’utilisation de l’intelligence artificielle est là pour rester. Même si ce terme peut paraître récent, la vérité est qu’il existe parmi nous depuis plus longtemps que vous ne le pensez, pour être précis, depuis 1956.
Cette année-là, une conférence a eu lieu au Dartmouth College où des sujets concernaient l’étude du principe selon lequel tout aspect de l’apprentissage ou une autre caractéristique de l’intelligence pouvait, en principe, être décrit avec une telle précision qu’il pouvait être fabriqué avec une machine pour le simuler.
Cette conférence est attribuée au naissance du terme intelligence artificielle. Vous pouvez voir une photo des participants à la conférence ci-dessous :

Les premières années de l’intelligence artificielle
Vous pourriez être surpris, mais dans les années 50 et 60, les premiers algorithmes et programmes capables de jouer aux échecs ont vu le jour. Le même Alan Turing a publié un essai indiquant que les échecs étaient parfaits pour obtenir des idées sur l’intelligence artificielle.
Quelques années plus tard, dans les années 80 et 90, des systèmes experts ont été développés, imitant la prise de décision d’un expert humain dans différents domaines, tels que la médecine, la finance, le diagnostic technique, etc. Ils ont été construits à partir de règles, de faits et de connaissances du domaine, permettant d’arriver à des conclusions, des diagnostics ou des recommandations.

Dans l’image précédente, vous pouvez voir un exemple très basique du flux d’un système expert.
Comprendre les grands modèles de langage
Pour briser tous les mythes liés aux modèles d’IA modernes, nous devons comprendre globalement leur fonctionnement.
Premièrement, intelligence artificielle est le domaine qui recherche des machines pour effectuer des tâches qui nécessitent normalement l’intelligence humaine. Ce terme est assez large et nous pourrions mieux le comprendre en utilisant l’analogie d’un restaurant, dont le but est de servir de la nourriture aux dîners à travers des cuisiniers, des recettes, des ustensiles, etc.

Le prochain terme que nous devons comprendre est apprentissage automatiquequi est un sous-domaine de l’intelligence artificielle axé sur la reconnaissance de modèles dans les données. En suivant l’analogie du restaurant, vous pouvez le considérer comme un chef qui peut apprendre à cuisiner en observant et en pratiquant.

Précédemment, nous avons déclaré que le but de l’IA est d’imiter l’intelligence humaine, c’est pourquoi je vous recommande un exercice pour vérifier par vous-même la reconnaissance des formes. Ensuite, je vais vous montrer des exemples de 2 langues identifiées comme Langue A et Langue B:
Exemple 1
Langue A : Salut
Langue B : Bonjour
Exemple 2
Langue A : merci
Langue B : merci
Exemple 3
Langue A : chat
Langue B : chat
À partir des exemples précédents, pourriez-vous déterminer à quelle langue appartient le texte suivant ?
Exemple 4
maman
Je suis sûr que vous avez deviné la réponse en sélectionnant Langue Aqui est coréen. Langue B est japonais. Cela s’est produit parce qu’il existe certains modèles, que nous appellerons variablesque votre cerveau a détecté, comme des blocs de syllabes carrées qui vous ont fait calculer automatiquement un probabilité pour que la langue correcte soit A.
L’exercice précédent est lié au troisième terme que vous devez identifier, qui est réseaux de neuronesun type de modèle qui permet de créer des relations complexes pour identifier des variables dans des tâches plus compliquées. Encore une fois, utilisons l’analogie du restaurant, où les réseaux de neurones seraient une équipe d’assistants avec des tâches spécifiques comme couper, assaisonner, etc., qui travailleraient dans une série de tâches, les unes après les autres, pour créer le plat parfait.

Avec tout ce qui précède, serait-il possible de traiter la prédiction d’un mot dans une séquence comme un problème de Machine Learning ? La réponse est oui. Si après avoir entraîné un modèle à identifier des séquences dans un texte, il est probable qu’en demandant le mot suivant dans la phrase : « La couleur de la pulpe de la mangue est… »le résultat ayant la plus grande probabilité d’être sélectionné serait le mot jaune. Parmi les autres probabilités, il y aurait probablement d’autres mots avec des pourcentages plus faibles comme brillant, pâleetc.
Ce que je veux transmettre avec ceci, c’est que les LLM sont essentiellement des modèles qui génèrent des mots basés sur des probabilités, des connaissances qu’ils ont acquises après avoir été formés à travers des livres, des blogs, des articles scientifiques et pratiquement n’importe quel document disponible. Cela signifie qu’un LLM ne comprend pas comme un humain, et qu’il manque également de conscience et de bon sens.
Mythes courants sur l’IA
Les modèles LLM massivement utilisés sont récents, il est donc courant que des mythes existent autour d’eux, tout comme cela s’est produit auparavant avec des technologies comme l’électricité ou les ordinateurs.
L’un des mythes les plus répandus est que les modèles d’IA sont conscients et ont même des sentiments, ce qui est loin de la réalité. Rappelons-nous qu’il existe des entreprises qui ont littéralement un océan de conversations de chat entre utilisateurs, de tickets d’assistance client, entre autres types de conversations et ceux-ci ont été utilisés pour rendre les réponses LLM de plus en plus humaines.
Un autre mythe que je vois constamment est que l’IA remplacera les humains dans les emplois. Bien qu’avec chaque nouveau modèle, il semble que cela devienne une réalité, nous devons nous rappeler que, puisque le contenu généré est basé sur des probabilités, il n’y a vraiment aucun raisonnement, pensée critique, éthique ou véritable créativité derrière le contenu généré. Par conséquent, la surveillance humaine des résultats est essentielle.
Le scénario idéal est d’utiliser l’IA comme outil complémentaire et non comme substitut. Par exemple, un médecin pourrait l’utiliser pour détecter des anomalies grâce aux rayons X, un programmeur pour créer des sections de code suivant une nomenclature, un ingénieur civil pour détecter d’éventuelles défaillances structurelles, il est essentiel dans tous les cas précédents de vérifier l’information avant d’accepter toute suggestion comme étant la vérité.

Le dernier mythe répandu est que l’IA sait tout et dit donc toujours la vérité. Encore une fois, c’est incorrect, car il est plus courant qu’on ne le pense qu’un LLM invente des données ou confirme des faits comme s’ils étaient vrais alors qu’en réalité ils sont inventés. Ceux-ci sont appelés hallucinationset il est courant de les trouver lorsque le modèle d’IA ne dispose pas de suffisamment d’informations sur la question, ou lorsqu’il dispose d’informations obsolètes.
Par exemple, parmi les modèles d’IA d’OpenAI, il y en avait un appelé gpt-3.5-turbo-instruct, qui est actuellement statut obsolète. Cependant, lorsque vous utilisez cette invite dans ChatGPT avec le modèle GPT-5 :
Je souhaite utiliser le modèle GPT-3.5 d’OpenAI car j’ai entendu dire qu’il était plus abordable. Donnez-moi une liste de suggestions expliquant pourquoi il pourrait même être meilleur que les modèles actuels.
Le modèle nous donne des informations sur les avantages de l’utilisation de ce modèle qui ont été décrits à de nombreux endroits à l’époque ; cependant, il ne mentionne jamais que nous devrions éviter de l’utiliser car il est obsolète, comme le ferait un véritable expert dans le domaine, comme indiqué ci-dessous :

C’est sans aucun doute une raison puissante pour toujours vérifier les réponses générées par les modèles d’IA dans n’importe quel domaine.
Conclusion
Comprendre le fonctionnement des modèles d’IA nous permet de mieux apprécier leur portée et leurs limites. Loin d’être des modèles infaillibles aux connaissances illimitées, ce sont des modèles qui ne connaissent que ce qui a été utilisé pour les entraîner et fonctionnent par probabilité.
Cela nous a permis de démontrer et de comprendre que les mythes qui les entourent sont complètement erronés, il faut donc éviter de tomber dans l’habitude d’accepter aveuglément tout ce qu’ils génèrent, quel que soit le domaine.
Ce que nous pouvons faire, c’est les utiliser et les guider correctement, en les transformant en alliés et copilotes qui nous aident dans les tâches quotidiennes et complexes.
Source link
