L’IA passe à DeepSeek par Michael Roberts
La plupart des lecteurs connaissent désormais la nouvelle. DeepSeek, une société chinoise d’IA, a publié un modèle d’IA appelé R1 dont les capacités sont comparables à celles des meilleurs modèles d’entreprises telles qu’OpenAI, Anthropic et Meta, mais qui a été formé à un coût radicalement inférieur et en utilisant des puces GPU moins avancées. DeepSeek a également rendu publics suffisamment de détails du modèle pour que d’autres puissent l’exécuter sur leurs propres ordinateurs sans frais.
DeepSeek est une torpille qui a frappé les sept plus grandes entreprises high-tech américaines sous la ligne de flottaison. DeepSeek n’a pas utilisé les puces et les logiciels les plus récents et les plus performants de Nvidia ; il n’a pas nécessité d’énormes dépenses pour former son modèle d’IA contrairement à ses rivaux américains ; et il offre tout autant d’applications utiles.
DeepSeek a construit son R1 avec les puces plus anciennes et plus lentes de Nvidia, dont les sanctions américaines avaient permis l’exportation vers la Chine. Le gouvernement américain et les titans de la technologie pensaient avoir le monopole du développement de l’IA en raison des coûts énormes impliqués dans la fabrication de meilleures puces et de modèles d’IA. Mais aujourd’hui, le R1 de DeepSeek suggère que les entreprises ayant moins d’argent pourront bientôt exploiter des modèles d’IA compétitifs. R1 peut être utilisé avec un budget restreint et une puissance de calcul bien inférieure. De plus, R1 est tout aussi bon que ses concurrents en matière d’« inférence », le jargon de l’IA pour désigner le moment où les utilisateurs remettent en question le modèle et obtiennent des réponses. Et il fonctionne sur des serveurs pour toutes sortes d’entreprises, de sorte qu’elles n’ont pas besoin de « louer » à des prix exorbitants des entreprises comme OpenAI.
Plus important encore, le R1 de DeepSeek est « open source », c’est-à-dire que les méthodes de codage et de formation sont ouvertes à tous, qui peuvent les copier et les développer. C’est un véritable coup porté aux secrets « propriétaires » qu’OpenAI ou Gemini de Google enferment dans une « boîte noire » afin de maximiser leurs profits. L’analogie ici est avec les produits pharmaceutiques de marque et génériques.
Le gros problème pour les entreprises américaines d’IA et leurs investisseurs est qu’il semble que la construction de gigantesques centres de données pour héberger de multiples puces coûteuses ne soit pas nécessaire pour obtenir des résultats suffisamment satisfaisants. Jusqu’à présent, les entreprises américaines ont multiplié les dépenses et tenté de lever des fonds colossaux pour y parvenir. En effet, le lundi même où le R1 de DeepSeek a fait la une des journaux, Meta a annoncé un nouvel investissement de 65 milliards de dollars, et quelques jours plus tôt, le président Trump a annoncé des subventions gouvernementales de 500 milliards de dollars aux géants de la technologie dans le cadre du projet Stargate. Ironiquement, le directeur général de Meta, Mark Zuckerberg, a déclaré qu’il investissait parce que « nous voulons que les États-Unis établissent la norme mondiale en matière d’IA, pas la Chine ». Oh mon Dieu.
Les investisseurs craignent désormais que ces dépenses soient inutiles et, plus précisément, qu’elles nuisent à la rentabilité des entreprises américaines si DeepSeek parvient à fournir des applications d’IA à un dixième du coût. Cinq des plus grandes valeurs technologiques axées sur l’IA – le fabricant de puces Nvidia et les soi-disant « hyperscalers » Alphabet, Amazon, Microsoft et Meta Platforms – ont collectivement perdu près de 750 milliards de dollars de leur valeur boursière en une journée. Et DeepSeek menace les profits des sociétés de centres de données et des opérateurs d’eau et d’électricité qui espèrent bénéficier de l’énorme « scale-up » des Sept Mercenaires. Le boom boursier américain est fortement concentré dans les « Sept Mercenaires ».
DeepSeek a-t-il donc percé la bulle boursière massive des valeurs technologiques américaines ? L’investisseur milliardaire Ray Dalio le pense. Il a déclaré au Financial Times que « les prix ont atteint des niveaux élevés en même temps qu’il existe un risque de taux d’intérêt, et cette combinaison pourrait faire éclater la bulle… La situation actuelle du cycle est très similaire à celle de 1998 ou 1999 », a déclaré M. Dalio. « En d’autres termes, il existe une nouvelle technologie majeure qui va certainement changer le monde et connaître le succès. Mais certaines personnes confondent cela avec la réussite des investissements. »
Mais ce n’est peut-être pas le cas, du moins pas pour l’instant. Le cours de l’action de la société de puces d’intelligence artificielle Nvidia a peut-être plongé cette semaine, mais son langage de codage « propriétaire », Cuda, reste la norme du secteur aux États-Unis. Bien que ses actions aient chuté de près de 17 %, cela ne fait que ramener le cours de l’action au niveau (très, très élevé) de septembre.
Ce qui doit mettre en colère les oligarques de la technologie qui lèchent les bottes de Trump, c’est que les sanctions américaines contre les entreprises chinoises et les interdictions d’exportation de puces n’ont pas empêché la Chine de faire encore plus de progrès dans la guerre des technologies et des puces électroniques avec les États-Unis. La Chine parvient à faire des progrès technologiques dans le domaine de l’intelligence artificielle malgré les contrôles à l’exportation introduits par l’administration Biden, destinés à la priver à la fois des puces les plus puissantes et des outils avancés nécessaires à leur fabrication.
Huawei, le champion chinois de la technologie, est devenu le principal concurrent de Nvidia en Chine pour les puces « d’inférence ». Et il a travaillé avec des entreprises d’IA, dont DeepSeek, pour adapter les modèles formés sur les GPU Nvidia afin d’exécuter l’inférence sur ses puces Ascend. « Huawei s’améliore. Ils ont une ouverture car le gouvernement dit aux grandes entreprises technologiques qu’elles doivent acheter leurs puces et les utiliser pour l’inférence », a déclaré un investisseur dans les semi-conducteurs à Pékin.
Il s’agit d’une nouvelle preuve que les investissements planifiés de l’État dans les technologies et les compétences technologiques de la Chine fonctionnent bien mieux que de s’appuyer sur des géants technologiques privés dirigés par des magnats. Comme l’a déclaré Ray Dallo : « Dans notre système, nous évoluons globalement vers un type de politique plus complexe dans lequel il y aura des activités mandatées et influencées par le gouvernement, car c’est si important… Le capitalisme à lui seul – la seule motivation du profit – ne peut pas gagner cette bataille. »
Les géants de l’intelligence artificielle ne sont toutefois pas encore des géants. Ils continuent de se développer en investissant toujours plus de milliards dans des centres de données et des puces toujours plus avancées. Cela consomme la puissance de calcul de manière exponentielle.
Et bien sûr, il n’y a aucune considération de ce que les économistes traditionnels aiment poliment appeler les « externalités ». Selon un rapport de Goldman Sachs, une requête ChatGPT nécessite près de 10 fois plus d’électricité qu’une requête de recherche Google. Le chercheur Jesse Dodge a fait quelques calculs approximatifs sur la quantité d’énergie utilisée par les chatbots IA. « Une requête sur ChatGPT consomme à peu près autant d’électricité que l’éclairage d’une ampoule pendant environ 20 minutes », dit-il. « Vous pouvez donc imaginer qu’avec des millions de personnes qui utilisent un tel appareil tous les jours, cela représente une quantité d’électricité vraiment importante. » Une consommation d’électricité accrue signifie une production d’énergie accrue et en particulier davantage d’émissions de gaz à effet de serre provenant des combustibles fossiles.
Google a pour objectif d’atteindre la neutralité carbone d’ici 2030. Depuis 2007, l’entreprise affirme que ses activités sont neutres en carbone grâce aux compensations carbone qu’elle achète pour égaler ses émissions. Mais à partir de 2023, Google a écrit dans son rapport de développement durable qu’elle ne « maintenait plus la neutralité carbone opérationnelle ». L’entreprise affirme qu’elle continue de faire pression pour atteindre son objectif de zéro émission nette d’ici 2030. « La véritable motivation de Google ici est de construire les meilleurs systèmes d’IA possibles », explique Dodge. « Et ils sont prêts à y consacrer une tonne de ressources, y compris des choses comme la formation des systèmes d’IA sur des centres de données de plus en plus grands jusqu’aux superordinateurs, ce qui entraîne une énorme consommation d’électricité et donc des émissions de CO2. »
Il y a aussi l’eau. Alors que les États-Unis sont confrontés à des sécheresses et à des incendies de forêt, les entreprises d’IA aspirent des eaux profondes pour « refroidir » leurs mégacentres de données afin de protéger les puces . De plus, les entreprises de la Silicon Valley prennent de plus en plus le contrôle des infrastructures d’approvisionnement en eau pour répondre à leurs besoins. Des recherches suggèrent, par exemple, qu’environ 700 000 litres d’eau auraient pu être utilisés pour refroidir les machines qui ont entraîné ChatGPT-3 dans les installations de données de Microsoft.
L’entraînement des modèles d’IA consomme 6 000 fois plus d’énergie qu’une ville européenne. En outre, si les minéraux tels que le lithium et le cobalt sont le plus souvent associés aux batteries du secteur automobile, ils sont également essentiels pour les batteries utilisées dans les centres de données. Le processus d’extraction implique souvent une consommation d’eau importante et peut conduire à la pollution, ce qui compromet la sécurité de l’eau.
Sam Altman, l’ancien héros à but non lucratif d’Open AI, qui cherche désormais à maximiser les profits de Microsoft, soutient que oui, malheureusement, il y a des « compromis » à court terme, mais qu’ils sont nécessaires pour atteindre ce que l’on appelle l’IA générale intégrée (AGI) ; et l’AGI nous aidera alors à résoudre tous ces problèmes, donc le compromis des « externalités » en vaut la peine.
L’intelligence artificielle généralisée (IAG) ? Qu’est-ce que c’est ? L’IAG est le Saint Graal des développeurs d’IA. Cela signifie que les modèles d’IA deviendront « superintelligents », bien au-delà de l’intelligence humaine. Lorsque cela sera réalisé, promet Altman, son IA ne sera pas seulement capable d’effectuer le travail d’un seul travailleur, elle sera capable d’effectuer tous leurs travaux : « L’IA peut faire le travail d’une organisation. » Ce serait le summum de la maximisation de la rentabilité en supprimant les travailleurs dans les entreprises (même les entreprises d’IA ?) car les machines IA prendraient en charge l’exploitation, le développement et la commercialisation de tout. C’est le rêve apocalyptique pour le capital (mais un cauchemar pour le travail : pas d’emploi, pas de revenu).
C’est pourquoi Altman et les autres magnats de l’IA ne cesseront pas d’agrandir leurs centres de données et de développer des puces toujours plus avancées simplement parce que DeepSeek a mis à mal leurs modèles actuels. Le cabinet d’études Rosenblatt a prédit la réponse des géants de la technologie : « En général, nous nous attendons à ce que l’accent soit mis sur l’amélioration des capacités et l’accélération de l’intelligence artificielle générale, plutôt que sur la réduction des dépenses. » Rien ne doit arrêter l’objectif d’une IA super-intelligente.
Certains voient dans la course à l’IA générale une menace pour l’humanité elle-même. Stuart Russell, professeur d’informatique à l’université de Californie à Berkeley, a déclaré : « Même les PDG qui se lancent dans la course ont déclaré que celui qui gagnerait a une forte probabilité de provoquer l’extinction de l’humanité dans le processus, car nous n’avons aucune idée de la façon de contrôler des systèmes plus intelligents que nous-mêmes », a-t- il déclaré. « En d’autres termes, la course à l’IA générale est une course vers le bord d’une falaise. »
Peut-être, mais je continue de douter que l’intelligence humaine puisse être remplacée par l’intelligence des machines, principalement parce qu’elles sont différentes. Les machines ne peuvent pas penser aux changements potentiels et qualitatifs. Les nouvelles connaissances proviennent de telles transformations (humaines), et non de l’extension des connaissances existantes (machines). Seule l’intelligence humaine est sociale et peut voir le potentiel de changement, en particulier social, qui mène à une vie meilleure pour l’humanité et la nature.
L’émergence de DeepSeek a montré que l’IA peut être développée à un niveau qui peut aider l’humanité et répondre à ses besoins sociaux. Elle est gratuite et ouverte et accessible au plus petit utilisateur et développeur. Elle n’a pas été développée dans un but lucratif ou pour faire du profit. Comme l’a dit un commentateur : « Je veux que l’IA fasse ma lessive et ma vaisselle pour que je puisse faire de l’art et de l’écriture, pas que l’IA fasse mon art et mon écriture pour que je puisse faire ma lessive et ma vaisselle. » Les managers introduisent l’IA pour « faciliter les problèmes de gestion au détriment de choses pour lesquelles beaucoup de gens ne pensent pas que l’IA devrait être utilisée, comme le travail créatif… Si l’IA doit fonctionner, elle doit venir de la base, sinon l’IA sera inutile pour la grande majorité des personnes sur le lieu de travail. »
Plutôt que de développer l’IA pour faire des profits, réduire les emplois et les moyens de subsistance des humains, l’IA, sous une propriété et une planification communes, pourrait réduire les heures de travail humain pour tous et libérer les humains du labeur pour se concentrer sur le travail créatif que seule l’intelligence humaine peut fournir. Rappelez-vous que le « Saint Graal » était une fiction victorienne et plus tard aussi une fiction de Dan Brown.
Michael Roberts
Source : https://thenextrecession.wordpress.com/2025/01/28/ai-going-deepseek/





