Fermer

mars 29, 2024

Comment la nouvelle IA Grok d’Elon Musk se compare à ses concurrents

Comment la nouvelle IA Grok d’Elon Musk se compare à ses concurrents


Près de deux semaines après le démarrage de xAI d’Elon Musk ouvert le modèle d’IA derrière Grok au public, son chatbot IA est sur le point d’être mis à niveau.

L’entreprise annoncé Grok-1.5 jeudi et a affirmé que son dernier modèle pouvait comprendre des documents plus longs, gérer des invites plus complexes et effectuer un raisonnement plus avancé.

Bien que Grok-1.5 semble être une avancée par rapport à la version 1.0 d’origine avec des améliorations en matière de codage et de compétences en mathématiques, son message d’annonce montre qu’il est toujours à la traîne par rapport à l’IA Gemini Pro 1.5 de Google, au GPT-4 d’OpenAI et à Claude 3 Opus d’Anthropic dans certains benchmarks. tests, tout en surpassant OpenAI sur un test clé HumanEval.

En rapport: Rencontrez Grok : Elon Musk dévoile un chatbot IA « épicé » criblé de « sarcasme » et « d’humour »

Grok-1.5 a obtenu un score supérieur à GPT-4 sur le HumanEval benchmark, qui se compose de 164 problèmes de programmation difficiles non inclus dans les données de formation du modèle d’IA. GPT-4 a obtenu un score de 67 % et Gemini Pro 1.5 a obtenu un score de 71,9 %, tandis que Grok-1.5 a reçu un score de 74,1 %.

La société xAI d’Elon Musk s’apprête à lancer une nouvelle version du chatbot Grok AI, un concurrent de ChatGPT. Photo de Jaap Arriens/NurPhoto via Getty Images.

Avec un score de 81,3% au MMLU test, qui couvre la connaissance de 57 matières du niveau élémentaire au niveau avancé, Grok-1.5 a obtenu un score proche du score de Google Gemini (83,7 %).

Il a également obtenu un score proche du score de 52,9 % du GPT-4, avec un score de 50,6 % sur le MATHÉMATIQUES test, un test de référence qui couvre les problèmes de compétition de mathématiques du primaire au secondaire.

En rapport: Elon Musk poursuit ChatGPT-Maker OpenAI et accuse l’entreprise de travailler pour « maximiser les profits de Microsoft, plutôt que pour le bénéfice de l’humanité »

Musk a déclaré vendredi publication sur les réseaux sociaux que Grok 1.5 devrait être disponible sur X, anciennement Twitter, d’ici la semaine prochaine.

Le propriétaire de X a de grandes attentes pour la prochaine génération de Grok, écrivant que la prochaine étape après Grok-1.5 surpassera l’IA actuellement disponible « sur toutes les mesures ». Grok 2 est « en formation maintenant », a-t-il écrit dans le message.

Grok AI est actuellement Seulement disponible à ceux qui ont un 16 $ par mois ou abonnement Premium+ supérieur sur X.

Musc poursuivi OpenAI, un concurrent de xAI, a demandé plus tôt ce mois-ci une décision de justice qui obligerait OpenAI à rendre publiques la recherche et la technologie derrière son IA.






Source link