Fermer

janvier 30, 2025

Les grands garçons d’Ai ont-ils juste été déjoués? / Blogs / perficient

Les grands garçons d’Ai ont-ils juste été déjoués? / Blogs / perficient


Donc, j’ai finalement pu creuser dans la dernière magie d’IA de Deepseek… et laissez-moi vous dire que c’est le genre de chose qui fait transpirer les sociétés d’un trillion à travers leurs costumes.

Voici l’accord: la formation des modèles AI de pointe en ce moment est stupidement cher. Nous parlons ouverts, anthropiques, et autres en brûlant 100 millions de dollars ou plus … Juste sur le calcul. Imaginez des centres de données massifs remplis de GPU qui coûtent autant voiture de luxe (40 000 $ la pop). C’est comme essayer de gérer un stand de limonade mais avoir besoin d’un plein soufflage centrale électrique Juste pour faire fonctionner le réfrigérateur.

Puis Deepseek se présente et va essentiellement, « Hé, et si nous faisions la même chose, mais pour seulement 5 millions de dollars? » Et – obtenez ceci – ils ne l’ont pas simplement dit. Ils l’ont en fait retiré.

Maintenant, si vous pensez, «D’accord, mais leur IA est-elle bonne?» La réponse est Oui. Cela va de côté avec GPT-4 et Claude, et dans certains cas, il gagne même. Le monde de l’IA est (comme diraient mes adolescents) secoue.

Comment ont-ils réussi cela?

Deepseek n’a pas simplement modifié l’ancienne formule – ils retourné toute la table et a commencé frais.

  1. Mathématiques plus intelligentes, moins de déchets: Imaginez l’IA traditionnelle comme quelqu’un qui écrit chaque numéro avec 32 décimales… ridiculement précis mais aussi exagéré. Deepseek était comme, «Euh, pourquoi pas simplement à 8 décimales? C’est assez bon. Et juste comme ça… 75% en moins d’utilisation de la mémoire.
  2. Traitement plus rapide: L’IA régulière se lit comme un élève de première année: «Le… rapide… Brown… Fox…» Deepseek? Il prend des phrases entières à la fois. Deux fois plus vite, presque aussi précis. Quand tu mâches milliards de motsce n’est pas un petit ajustement… c’est un Changeur de jeu.
  3. Une équipe de rêve de l’IA, pas un groupe d’un seul homme: Au lieu d’un gigantesque modèle essayant de tout faire (comme faire une personne être médecin, avocat et ingénieur logiciel en même temps), Deepseek a construit un système expert. Différents «spécialistes» d’IA s’activent uniquement en cas de besoin.

Maintenant, contrastez cela avec les modèles traditionnels, où Chacun de leurs 1,8 billions de paramètres est éveillé et travaille 24/7… Comme exécuter votre bonnet AC Même en hiver. Deepseek? Ils ont 671 milliards de paramètres au total, mais seulement 37 milliards de fonctions à tout moment. C’est comme avoir une équipe massive de consultants sur appel… Mais ne payez que ceux que vous utilisez réellement.

Les résultats? Absolument étonnant:

  • Coût de formation: 100 M $ → 5 M $
  • GPUS nécessaires: 100 000 → 2 000
  • Coûts de l’API: En baisse de 95%
  • Peut fonctionner GPUS de jeu Au lieu d’exiger un supercalculateur de la taille d’un entrepôt.

À ce stade, vous pensez probablement, «D’accord, mais où est la prise?» Voici la chose… il n’y en a pas. C’est open source. Pas de mystère de la boîte noire. Pas de gardien d’entreprise. Le code? Publique. La recherche? En plein air. Ce n’est pas magique, juste Brilliant Engineering.

Pourquoi c’est terrifiant pour nvidia

En ce moment, Nvidia est assis jolie sur un CAP boursière de 2 billions de dollarsratissant des bénéfices absurdes parce que les entreprises d’IA ont pas de choix Mais pour acheter leur GPU super coûteux. Deepseek est juste entré et dit, «En fait… vous ne le faites pas.

Si l’IA peut soudainement courir GPU de jeu régulierNvidia’s 90% de marges bénéficiaires ressemble beaucoup à un espèces en voie de disparition.

Et voici le vrai kicker… Deepseek a réussi ça avec moins de 200 personnes. Pendant ce temps, Meta a des équipes où Budget salarial seul est plus grand que Deepseek Coût de formation entier… Et en quelque sorte, Les modèles de Meta ne sont toujours pas aussi bons.

Ai vient de recevoir Chemin Plus accessible

Il ne s’agit pas seulement d’une entreprise intelligente. C’est un Histoire de perturbation du manuel. Les grands titulaires optimisent existant processus. VRAIS PERRRUPTEURS Repenser les fondamentaux. Deepseek a essentiellement demandé, « Et si nous faisions ça plus intelligent, au lieu de jeter plus de matériel au problème? »

Que se passe-t-il d’ici maintenant?

  • L’IA devient chemin moins cher et plus accessible.
  • Les «AI Moats» de Big Tech commencent à chercher Plus comme des flaques d’eau.
  • Startups qui Je ne pouvais pas se permettre l’IA avant? Maintenant, ils le peuvent.
  • Coûts matériels Prune– sauf peut-être pour Nvidia, qui pourrait commencer à regarder par-dessus son épaule.

Bien sûr, Openai et Anthropic ne asseyez-vous là et prenez ceci. Ils se précipitent probablement déjà pour mettre en œuvre ces idées. Mais Le génie de l’efficacité est hors de la bouteille. Il n’y a pas de retour à l’ère «Just More GPUS dessus».

Cela pourrait être le moment «Uh-oh» de l’IA pour Big Tech

Cela ressemble à l’un de ces moments sur lesquels nous nous repenserons et dire, « Oh ouais, ça a tout changé. »

Comme lorsque les PC ont rendu les mainframes obsolètes… comme lorsque le cloud computing a tué des serveurs sur site coûteux… comme lorsque Netflix a rendu Blockbuster idiot.

Le paysage de l’IA fondamentalement décalé. La seule question maintenant est À quelle vitesse la vieille garde s’effondre.






Source link