janvier 30, 2025

Est-ce vraiment Deepseek FTW? / Blogs / perficient

Donc, Deepseek vient de laisser tomber leurs derniers modèles d’IA, et bien que ce soit excitant, il y a des mises en garde à considérer. En raison des contrôles d’exportation américains autour du matériel avancé, Deepseek a fonctionné sous un ensemble de contraintes uniques qui les ont forcés à faire preuve de créativité dans leur approche. Cette créativité semble avoir produit de réels progrès dans la réduction de la quantité de matériel requise pour la formation de modèles haut de gamme dans des délais raisonnables et pour l’induction de ces mêmes modèles. Si la réalité confirme les affirmations, cela pourrait être un changement de mer dans les coûts monétaires et environnementaux de la formation et de l’hébergement des LLM.

En plus de l’efficacité accrue, le modèle R1 de Deepseek continue de gonfler la courbe d’innovation autour des modèles de raisonnement. Les modèles qui suivent cette chaîne émergente de la pensée paradigme dans leurs réponses, fournissant une explication de leur pensée d’abord, puis en résumant en réponse, fournissent un changement de pas de la qualité de la réponse. Surtout lorsqu’il est associé à un chiffon et à une bibliothèque d’outils ou d’actions dans un cadre agentique, la cuisson de ce modèle émergent dans les modèles au lieu de l’inclure dans l’invite est une innovation sérieuse. Nous allons voir encore plus les fournisseurs de modèles open source suivre Openai et Deepseek dans ce domaine.

Considérations clés

L’un des facteurs clés pour considérer l’adoption de modèles Deepseek sera les exigences de résidence des données pour votre entreprise. Pour l’instant, l’hébergement privé autogéré est la seule option pour maintenir la résidence de données Full US, UE ou UK avec ces nouveaux modèles Deepseek (les besoins les plus courants pour nos clients). Les mêmes restrictions d’exportation limitant le matériel disponible pour Deepseek ont également empêché OpenAI d’offrir leurs services complets avec une résidence de données chinoise complète. Cela fait de Deepseek une offre convaincante pour les entreprises ayant besoin d’une option en Chine. Il reste à voir si les hyperscalers ou autres fournisseurs offriront des modèles Deepseek sur leurs plateformes (Avant de réussir à publier, Microsoft a fait un mouvement et propose Deepseek-R1 dans Azure Ai Foundry). La bonne nouvelle est que les modèles sont très efficaces et que l’hébergement d’image de soi est possible et pas trop cher pour l’inférence avec ces modèles. L’inconvénient consiste à gérer la capacité provisoire lorsque les charges de travail peuvent être inégales, c’est pourquoi les modèles à paiement sont souvent les plus rentables.

Nous nous attendons à ce que ces nouveaux modèles et les prix réduits qui leur soient associés aient une forte pression à la baisse sur les coûts par altitude pour d’autres modèles hébergés par les hyperscaleurs. Nous prêterons une attention particulière à Microsoft car ils continuent de diversifier leurs offres au-delà de l’OpenAI, en particulier avec leur décision de rendre Deepseek-R1 disponible. Nous nous attendons également à voir les entreprises américaines reproduire les succès de Deepseek, d’autant plus que le visage étreint a déjà commencé à travailler dans leur Projet R1 ouvert Pour prendre les recherches derrière les annonces de Deepseek et la rendre pleinement open source.

Que faire maintenant

Il s’agit d’un bond en avant et progresse dans le sens de ce que nous avons dit depuis longtemps, c’est la destination – des modèles plus et plus petits ciblés sur des cas d’utilisation spécifiques. Pour l’instant, lorsque nous regardons nos clients, nous conseillons une bonne dose de «attendre et voir». Comme cela a été le cas au cours des trois dernières années, cette technologie évolue rapidement, et nous nous attendons à ce qu’il y ait de nouveaux développements dans un avenir proche des autres fournisseurs. Notre rappel perpétuel à nos clients est que la sécurité et la confidentialité l’emportent toujours sur les économies de coûts marginales à long terme.

Le FAQ complète de Stratechery est une excellente ressource pour plus d’informations.

Source link

Blog ARC Optimizer

janvier 30, 2025

Est-ce vraiment Deepseek FTW? / Blogs / perficient

Articles similaires

Blog ARC Optimizer

Partager :

Articles similaires