

DeepSeek R1 suscite d’intenses discussions entre influenceurs sur les coûts et l’innovation de l’IA, révèle GlobalData
DeepSeek, une start-up chinoise en pleine croissance spécialisée dans l’IA, a rapidement attiré l’attention des influenceurs des médias sociaux avec son modèle R1, un modèle avancé de langage étendu (LLM) qui défie les leaders du secteur comme OpenAI et Anthropic à une fraction du coût. Son efficacité dans les tâches de raisonnement, son cadre open source et sa dépendance minimale aux GPU haut de gamme ont alimenté les discussions, déclenchant des réactions du marché et soulevant des questions sur l’évolution du paysage concurrentiel de l’IA, révèle la plateforme d’analyse des médias sociaux de GlobalData , une société leader dans le domaine des données et de l’analyse.
Les influenceurs soulignent les performances impressionnantes de DeepSeek R1 en termes de réduction de la dépendance aux GPU haut de gamme. L’impact soudain sur les valeurs technologiques, en particulier Nvidia, un important fournisseur de GPU, est également au centre des discussions des influenceurs, certains le considérant comme une réaction excessive.
Shreyasee Majumder, analyste des médias sociaux chez GlobalData, commente : « Les discussions entre les influenceurs mettent en évidence les économies de coûts importantes de DeepSeek R1 par rapport aux LLM existants. Le coût d’inférence de R1 est environ 93 % inférieur à celui de son prédécesseur (o1), ce qui permet une exécution locale sur des postes de travail haut de gamme et élimine les limites de débit. Cette efficacité découle des avancées algorithmiques, notamment la formation dans FP8 et la prédiction multi-token, permettant un coût de formation en millions de dollars considérablement réduit. Cependant, ce chiffre omet les dépenses de recherche antérieures, ce qui implique que la réplication du succès de DeepSeek nécessite un investissement préexistant substantiel.
« L’ascension rapide de DeepSeek au sommet de l’App Store américain a encore intensifié les spéculations sur son succès, soulevant des questions quant à savoir si ce succès est le fruit d’une véritable innovation technologique ou d’une stratégie géopolitique plus large. En outre, des inquiétudes importantes ont émergé concernant la confidentialité des données et les risques potentiels pour la sécurité nationale, notamment liés au transfert éventuel des données des utilisateurs américains vers la Chine. »
Vous trouverez ci-dessous quelques opinions d’influenceurs populaires capturées par la plateforme d’analyse des médias sociaux de GlobalData :
« DeepSeek R1 montre que la course à l’IA sera très compétitive et que le président Trump a eu raison d’annuler le décret Biden, qui a paralysé les entreprises américaines d’IA sans se demander si la Chine ferait de même. (Évidemment non.) J’ai confiance dans les États-Unis, mais nous ne pouvons pas être complaisants. »
« NVidia traverse une très mauvaise journée. OpenAI est encore pire. Son modèle économique (faire payer cher les LLM) vient d’exploser, DeepSeek les dépasse et beaucoup des talents restants vont probablement commencer à se demander s’ils doivent quitter le navire. Et tout cela après qu’Elon Musk a déclaré que Stargate était une connerie, tandis que Microsoft a largement choisi de se retirer. NVidia sera certainement encore là l’année prochaine ; OpenAI pourrait bien être à court de liquidités. »
« Deepseek est désormais n°1 sur l’AppStore, surpassant ChatGPT. Pas besoin de supercalculateurs NVIDIA ni de 100 millions de dollars. Le véritable trésor de l’IA n’est pas l’interface utilisateur ou le modèle, ils sont devenus des produits de base. La véritable valeur réside dans les données et les métadonnées, l’oxygène qui alimente le potentiel de l’IA. La fortune du futur ? Elle réside dans nos données. Deepgold. »
« 1) DeepSeek r1 est réel avec des nuances importantes. Le plus important est le fait que r1 est tellement moins cher et plus efficace à inférer que o1, pas à partir du chiffre de formation de 6 millions de dollars. r1 coûte 93 % de moins à utiliser que o1 par API, peut être exécuté localement sur une station de travail haut de gamme et ne semble pas avoir atteint de limites de débit, ce qui est fou. Un calcul simple est que chaque paramètre actif de 1b nécessite 1 Go de RAM dans FP8, donc r1 nécessite 37 Go de RAM. Le traitement par lots réduit considérablement les coûts et plus de calcul augmente les jetons/seconde, ce qui reste un avantage pour l’inférence dans le cloud. Je voudrais également noter qu’il y a une véritable dynamique géopolitique en jeu ici et je ne pense pas que ce soit une coïncidence que cela soit sorti juste après « Stargate ». RIP, 500 milliards de dollars – nous vous connaissions à peine… »
« DeepSeek est un modèle LLM compétitif pour les cas d’utilisation grand public… lancer une infrastructure d’IA plus large est une toute autre histoire et rien avec DeepSeek ne nous fait croire autre chose. Il s’agit d’AGI pour les grandes technologies et du bruit de DeepSeek. De plus, aucune technologie américaine n’utilise cette technologie. Acheter de l’oppy »
« Étant donné que cela a pris de l’ampleur : – L’équipe DeepSeek est évidemment très talentueuse – La technologie DS est incroyable et impressionnante – Aucune haine n’est dirigée contre eux ou la technologie Je reste sceptique quant au récit, tout comme je ne crois pas aux histoires sur la façon dont des entreprises célèbres ont été fondées et je ne crois pas aux récits déclarés du gouvernement américain sur toute une série de questions. Les modèles fondateurs sont étroitement liés à la géopolitique. Lorsque les gouvernements et la géopolitique sont impliqués, être sceptique est une bonne position de départ. »
« Si vous faites confiance à ce que les Chinois vous disent, si vous installez cette application sur votre téléphone, elle aura accès à vos informations. Lisez la politique de confidentialité. Non merci. #DeepSeek »
Source : COMMUNIQUÉ DE PRESSE GlobalData 29/01/2025.
En savoir plus sur Fluides et Lubrifiants
Abonnez-vous pour recevoir les derniers articles par e-mail.