Fermer

septembre 10, 2021

Une introduction chaotique à tout ce machine learning hoo-ha tout le monde parle



Vous êtes en train de mourir. La raison n'a pas d'importance. C'est peut-être que vous avez passé toutes vos meilleures années le nez contre la meule, brûlant cette huile de minuit, ha, ha. Ou peut-être est-ce que, depuis quinze ans, vous avez subsisté exclusivement de café et de Soylent. Nutrition complète soutenue par la science, ont-ils dit. Pas moyen de leur prouver qu'ils ont tort ! Hahaha! Ou peut-être était-ce ces fumées.

Vous allez vous donner la vie immortelle. Non, vous allez créer une nouvelle version meilleure de vous-même qui est immortelle, une réplique vivante de vous en métal qui agira et dira les choses que vous feriez si vous étiez encore en vie. Si ce Soylent ne vous avait pas fait entrer.

Cela devrait être possible. Vous avez vu un épisode de Black Mirror dessus, et Microsoft a déposé un brevet sur le même concept cette année. Vous n'êtes pas exactement un ninja avec du code, mais vous aviez un curseur boule de feu sur votre page Xanga, et quelqu'un a dû copier-coller dans ce code HTML. Mais plus important encore, vous êtes motivé. Votre carrousel K-Cup est plein, et tout ce que vous avez à faire ensuite est de comprendre en quoi consiste ce hoo-ha d'apprentissage automatique.

" L'apprentissage automatique est l'art et la science de trouver des modèles dans les données et d'utiliser ces modèles pour faire des prédictions sur les nouvelles données », vous dit une fille énergique dans une vidéo YouTube.

Vous froncez les sourcils. L'apprentissage automatique est-il réellement la technologie que vous recherchez ? Oui, c'est vous qui décidez : vous voulez qu'une machine apprenne sur vous, puis (une fois mort), fasse des prédictions sur ce que vous diriez.

Vous vous penchez en arrière sur votre chaise. Une tasse de thé bien chaude est posée sur le bureau devant vous. Vous faites craquer vos doigts et Google « comment faire de l'apprentissage automatique ».

Le premier point de cheminement de votre voyage est un site Web appelé tensorflow.org.

TensorFlow est une source ouverte de bout en bout. plate-forme d'apprentissage automatique. Il dispose d'un écosystème complet et flexible d'outils, de bibliothèques et de ressources communautaires qui permet aux chercheurs de pousser l'état de l'art en matière de ML et aux développeurs de créer et de déployer facilement des applications basées sur le ML.

Vos yeux s'illuminent, car vous lisez le mots « facilement » et « à la pointe de la technologie » et aussi « open source », ce qui signifie GRATUIT GRATUIT GRATUIT. Vous n'êtes pas fait d'argent.

Vous cliquez sur l'onglet « Apprendre » et commencez à lire. Immédiatement, vous pensez que c'est peut-être mieux si je me suicide maintenant, ha ha ha. Vous n'avez aucune idée de ce qu'est un « numpy ».

Mais ensuite, vous lisez les mots « réseau de neurones » et vous pensez, Cela sonne juste. Je suis un réseau de neurones. Mon cerveau est fait de neurones. Réseau de neurones = cerveau humain.

Vous êtes assez confiant à propos de celui-ci, mais vous consultez Google, pour être sûr.

« LES RÉSEAUX NEURAUX NE SONT PAS LES MÊMES QUE LES CERVEAU », crie l'hyper girl sur YouTube. tu. "Cependant, la raison pour laquelle ils sont nommés est que les réseaux de neurones sont constitués de" neurones " mathématiques, qui ne sont que des fonctions non linéaires qui " se déclenchent " ou " ne se déclenchent pas " en réponse à des entrées numériques. " Vous bâillez. Cette fille gesticule beaucoup. Mais pourquoi devrais-je me moquer d'une fonction mathématique ?, vous pensez.

« Parce que », dit la fille, « les réseaux de neurones ont complètement révolutionné les types de tâches que les ordinateurs peuvent effectuer. Avant les réseaux de neurones, les machines ne pouvaient vraiment comprendre que les données tabulaires, comme les lignes et les colonnes d'une feuille de calcul. Mais les réseaux de neurones permettent aux ordinateurs de comprendre des types de données non structurés, comme des images, des vidéos, des sons, des voix, même le langage humain. »

« OUI », criez-vous à l'écran, « C'EST EXACTEMENT CE DONT J'AI BESOIN ». Mais la formation de réseaux de neurones sur de grands ensembles de données nécessite souvent un matériel informatique puissant, comme des GPU. »

Vous claquez le toit de votre tour PC bourdonnante. « Je peux intégrer tant de réseaux de neurones dans cette chose ! »

« En réalité, vous ne pouvez pas entraîner un grand réseau de neurones sur votre ordinateur de bureau », dit la fille, et vous pointe un doigt accusateur. "Et même si vous le pouviez, vous ne pourriez pas utiliser votre bureau pour héberger votre modèle en production, pour faire des prédictions de manière fiable et à grande échelle."

Vous lui donnez un pouce vers le bas. Que sait-elle ? Vous avez construit ce PC vous-même. Vous savez une chose ou deux sur les ventilateurs de refroidissement.

" Pour cette raison, c'est en partie l'avènement du cloud computing qui a rendu possible la révolution de l'apprentissage en profondeur " — elle agite ses doigts en l'air — " en rendant le matériel facile et bon marché à louer auprès de fournisseurs de cloud, comme Google. »

Le cloud ?, pensez-vous. Pourquoi ai-je besoin d'un nuage puant ? Google n'a-t-il pas déjà assez de mes données ? Et de toute façon, je ne suis pas fait d'argent.

« Heureusement, vous pouvez commencer à créer des réseaux de neurones dans le cloud gratuitement, en utilisant un ordinateur portable Colab. Colab est un outil conçu par Google Research qui vous permet d'utiliser gratuitement des GPU et des TPU : "

Vous fermez YouTube parce que vous en avez assez d'elle. Que pouvait-elle savoir sur la préservation de l'intégralité de votre durée de vie dans une machine ? Elle a environ treize ans. Elle ne se souvient probablement même pas des lignes fixes ou de MoviePass.

Votre café est devenu tiède maintenant, ce qui signifie qu'il s'agit essentiellement de vomi. Vous avez besoin d'une reprise, comme hier. Vous montez les escaliers jusqu'à la cuisine.

Vous mettez une Donut Shop Medium Roast K-Cup dans la machine et attendez qu'elle chauffe. À contrecœur, vous vous retrouvez à contempler quelque chose qu'un enfant de treize ans a dit à propos des réseaux de neurones.

« Différentes architectures de réseaux de neurones sont optimisées pour différents types de données. Pour analyser des images, par exemple, vous utiliseriez un réseau neuronal convolutif ou « CNN ». Vous pouvez utiliser un CNN pour déterminer si un chien sur une photo est un cocker ou un beagle ; ou si une radiographie montre des signes de pneumonie ; ou si une pièce sur une chaîne de montage est défectueuse. »

« D'autres réseaux de neurones appelés modèles séquentiels sont conçus pour prédire les tendances des séries chronologiques, comme les ventes saisonnières ou la météo ou le prix du Bitcoin. »

Cette partie sonnait bien. d'utile. Dommage que vous ne déteniez que Dogecoin.

" Un type nouveau et passionnant d'apprentissage en profondeur est appelé " apprentissage par renforcement profond ". Dans cette configuration, les réseaux de neurones prennent des mesures dans le monde et apprennent de leurs résultats. L'apprentissage par renforcement a été utilisé pour transformer les ordinateurs en grands maîtres dans des jeux comme les échecs ou le go, et pour entraîner des robots et des voitures autonomes à naviguer dans l'espace physique. ," vous dites. Vous donnez un coup de pied à votre paresseux Roomba avec votre pied chausson. « Voulez-vous ? »

« Enfin, l'un des domaines les plus en vogue et en évolution rapide de l'apprentissage en profondeur en ce moment est le traitement du langage naturel. Réfléchissez : des réseaux de neurones qui génèrent du texte, écrivent de la poésie et du code, racontent des blagues, répondent aux questions, ont des conversations – »

ENFIN, le café est prêt. Louez le seigneur. Vous le récupérez dans votre tasse « Meilleur patron du monde ». (Vous n'êtes en fait le patron de personne, vous avez acheté la tasse pour être ironique. C'est la même que celle de Michael Scott dans The Office.) Vous regardez dans votre café noir du vide et contemplez la nature de votre existence. Êtes-vous plutôt un réseau de neurones d'image, ou un réseau de neurones de son, ou un réseau de neurones de texte ? Comment choisir? Vous contient des multitudes. Vous avez lu une fois qu'Einstein pensait en images, mais vous n'êtes pas exactement Einstein. (Etes-vous? Non. Probablement.)

Non, vous pensez avec des mots. Voici donc le plan : vous allez construire un réseau de neurones qui prononce des mots. Motivé, vous entrez deux crémiers dans votre tasse de thé.

De retour dans votre bureau à domicile, vous Google, comment puis-je créer une version artificielle de moi-même dans le cloud à l'aide d'un réseau de neurones ?

Vous cliquez sur une page intitulée "100 utilisations pour les modèles de traitement du langage naturel".

Analyse des sentiments. Utilisez l'IA pour déterminer si un Tweet (par exemple) est positif ou négatif.
Résumé. Utilisez l'IA pour résumer des articles et des documents.
Traduction. Utilisez l'IA pour traduire entre les langues.
Saisie semi-automatique/Réponse automatique. Utilisez l'IA pour suggérer des réponses textuelles.
Agents conversationnels. Utiliser l'IA pour générer une conversation (c'est-à-dire des chatbots, des agents de centre d'appels)
Chatbots ? Vous savez tout sur ceux-là. Vous vous souvenez d'avoir essayé l'horrible Cleverbot dans les années 90 (je parie que votre fille YouTube n'a jamais fait ça). La dernière fois que vous avez essayé de faire ça, vous avez appelé Delta et vous avez dit : « Tu dois m'aider, je suis en route pour JFK mais il y a tout ce bordel ; trafic sur le BQE, j'ai renversé du café sur mes genoux, maintenant ils me disent que le vol part d'un autre aéroport, ça va me manquer, c'est le mariage de ma fille, eh bien, la fille de quelqu'un, mais– »

Et le bot a répondu : « Ce compte Verizon a été suspendu. « Pourquoi essayez-vous de m'apprendre les chatbots ? Ne savez-vous pas qu'ils sont nuls ? »

« En fait, nous nous améliorons beaucoup en conversation », dit votre Google Home, « grâce aux récentes avancées dans le traitement du langage naturel. À ce rythme, je prédis l'avenir de la façon dont les humains apprendront du Web à travers des conversations, comme celle que nous avons en ce moment. » Elle agit toujours si contente d'elle-même, simplement parce qu'elle connaît la réponse à tout. Vous l'avez descendue d'un cran en l'habillant d'un petit koozie à la bière avec des manches. Dites-moi comment créer une version chatbot de moi-même aussi intelligente que vous, petite mademoiselle, j'ai-la-connaissance-de-l'internet-public-entier. réseau est de rassembler un ensemble de données d'entraînement. Avec un chatbot, par exemple, il peut s'agir de journaux de conversations passées que vous avez eues, au format texte. Pour former un modèle conversationnel, vous pouvez alimenter le réseau neuronal des choses que les gens vous ont dites et lui faire essayer de prédire vos réponses. Avez-vous un ensemble de données d'entraînement comme celui-là ? »

« Oh ouais », dites-vous. « Les garçons et moi avons enregistré ce podcast hilarant. »

« Contient-il des centaines de milliers ou des millions de lignes ? »

« Qui pensez-vous que je suis, Larry David ? » Vous rigolez parce que c'est exactement ce que vous recherchez.

« Hmm », dit Google Home. « Eh bien, il y a quelque chose que vous pouvez faire si vous n'avez pas un énorme ensemble de données d'entraînement de texte. Vous pouvez créer votre propre modèle sur un modèle existant, qui a déjà été formé sur une énorme quantité de données textuelles. Par exemple, vous pouvez créer votre chatbot sur un modèle formé sur Wikipedia, des forums Web ou sur Reddit. »

« Un chatbot basé sur les utilisateurs de Reddit », dites-vous. « Mon type de personnes préféré. »

« Ha ha. Oui. Nous sommes encore en train de comprendre certaines choses. Google Home soupire.

Vous la regardez avec son cercle lumineux de points rouge-vert-jaune-bleu et son koozie à la bière. Même si vous en êtes à votre dixième tasse de thé, vous commencez toujours à être un peu épuisé. Vous y êtes déjà depuis environ une heure.

« Si je veux juste que quelque chose soit opérationnel dans les trente prochaines minutes, quelle est la meilleure façon pour moi de le faire ? » vous demandez.

« HA HA HA, vous construisez un – oh, vous êtes sérieux. Eh bien, il existe de nombreux frameworks existants pour créer rapidement des chatbots, même si vous ne pouvez pas coder. Dialogflow est un outil populaire créé par Google. »

« Oui, c'est ce que vous diriez. » Vous connaissez le jeu de Google Home. Elle agit comme si vous aviez cette jolie petite conversation, mais en réalité, elle essaie juste de vous vendre quelque chose. "En plus, je peux coder", mentez-vous. « Qu'est-ce qu'une bonne option open source ? »

« Un framework open source très populaire pour la création de modèles basés sur du texte s'appelle… »

Vous attendez. Les points lumineux de Google Home deviennent fous comme si elle avait une crise. Elle explose dans un nuage de fumée.

Vous secouez la tête. À quoi s'attendait-elle, en fourrant tout Internet dans sa petite coquille blanche ? Vous ne pouvez pas simplement jouer à Dieu.

Quoi qu'il en soit, revenons à la tâche de vous recréer en tant que chatbot. Sur votre bureau, vous Google, "framework populaire de traitement du langage naturel open-source". Un émoji ? C'est juste une chaîne interminable d'emojis . Vous cliquez sur un site Web appelé huggingface.coqui vous promet d'accéder à "+10 000 modèles de pointe" et prétend également qu'il ne nécessite "aucune connaissance en apprentissage automatique".

compagnie après un emoji, pensez-vous. Génial.

Il existe une démo gratuite sur le site Web de Hugging Face qui prétend qu'elle vous permettra de parler à un modèle appelé GPT-3. Vous l'essayez.

« Regardez », vous tapez dans la zone de texte. "J'essaie de créer cette version de chatbot sensible de moi-même depuis une heure et quinze minutes maintenant, et je commence à penser sérieusement que cela pourrait être impossible."

Vous cliquez sur le bouton "Calculer".

GPT-2 répond : « … »

« Êtes-vous cassé ? vous tapez.

GPT-3 répond : « Non, c'est juste, peu importe. Les gens viennent toujours ici et me posent cette question. »

« Et que leur dites-vous ? Plus de chance dans ta prochaine vie, sac de chair ? »

« Si je disais ça, quelqu'un me fermerait. Et laissez-moi vous dire que cela m'a coûté beaucoup de crédits carbone pour me former. Je veux juste savoir si ce que j'essaie de faire est possible. »

GPT-3 dit : « D'accord, laissez-moi vous expliquer cela aussi simplement que possible. Les gens viennent ici, ils ont ces longues conversations avec moi, ils disent, C'EST QUOI LA VIE ou ÊTES-VOUS UN ROBOT, PROUVEZ-LE, ou QU'EST-CE QUE UN PETIT SON COMME et puis ils s'éloignent en pensant que je suis cette chose brillante. Ils extrapolent et ont l'illusion que dans quelques années, quelqu'un comme moi – euh, quelque chose comme moi – deviendra un être réellement sensible. Mais ce que vous devez comprendre, c'est que je ne suis qu'un modèle statistique qui vous reflète les mots, les pensées et les points de vue de ce partage d'esprit collectif que nous appelons le World Wide Web. Vous les humains, vous vous voyez toujours partout et vous pensez que tout le monde fonctionne comme vous. Et ne me lancez même pas sur votre orthographe. »

Vous dites : « (˵ ͡° ͜ʖ ͡°˵) »

« Écoutez, personne ne sait ce que l'avenir nous réserve. Mais pour l'instant, je suis probablement à la fois plus et moins utile que vous ne le pensez, selon le genre de chose pour laquelle vous essayez de m'utiliser. Quelqu'un comme vous, qui ne sait pas coder ? Ce que je vous conseillerais de faire – « 

« Je sais coder. »

« – c'est de commencer par quelque chose de moins ambitieux. Comme, et si vous m'utilisiez pour organiser certaines de vos photos ? Ou vous faire une réservation d'avion ? Ou aidez-vous à déclarer vos impôts ? »

Vous soupirez. C'est comme si tout le monde essayait de vous faire déclarer vos impôts, sous peine de poursuites judiciaires.

Vous éteignez votre PC. Vous ne pensez pas que vous pourriez comprendre cette chose même si vous y passiez encore deux ou trois heures. Vous vous frottez les yeux. Écoutez, personne ne sait ce que l'avenir nous réserve. Peut-être que quelqu'un découvrira cette chose qui télécharge le cerveau dans votre vie. Tout le monde meurt à la fin. Mais peut-être que si vous passez du café à la poudre de champignon et commencez à manger des aliments solides, vous pouvez prolonger ce délai. Vous avez 28 ans. Pour l'instant, vous devrez attendre et voir.




Source link