Chargement en cours

Eridu secoue le monde des datacenters IA avec un hyperswitch optique révolutionnaire

datacenters-innovateurs

Dans la course effrénée à l’intelligence artificielle, l’infrastructure réseau des datacenters est devenue le goulot d’étranglement majeur. Pendant que les puces de calcul progressent à vitesse grand V, les réseaux qui les interconnectent peinent à suivre le rythme, créant un déséquilibre critique pour l’avenir de l’IA.

C’est dans ce contexte qu’Eridu, jeune pousse technologique basée à Saratoga en Californie, sort de l’ombre avec une ambition démesurée : repenser entièrement l’architecture réseau des centres de données dédiés à l’intelligence artificielle.

Un financement massif pour une ambition démesurée

Fondée en 2023, Eridu vient de boucler une levée de fonds colossale de plus de 200 millions de dollars. Un montant qui témoigne de l’intérêt des investisseurs pour cette technologie de rupture.

Le tour de table a été orchestré par Socratic Partners, rejoint par des pointures comme John Doerr, Hudson River Trading, Capricorn Investment Group et Matter Venture Partners. Un consortium d’investisseurs qui mise gros sur la capacité d’Eridu à transformer le marché.

Le nom de l’entreprise n’a pas été choisi au hasard : il fait référence à l’ancienne cité mésopotamienne d’Eridu, considérée comme l’une des plus anciennes villes du monde, symbole de fondations solides et pérennes.

Une équipe de vétérans du réseau optique

À la tête d’Eridu, on retrouve Drew Perkins, entrepreneur aguerri qui a cofondé Lightera (rachetée par Ciena) et Infinera, cette dernière ayant été acquise par Nokia pour la somme impressionnante de 2,3 milliards de dollars.

Il s’entoure de Mike Capuano comme directeur du développement commercial, Omar Hassen au poste de directeur produit et Promode Nedungadi comme directeur technique. Une dream team issue du monde des réseaux optiques.

Pourquoi les datacenters IA nécessitent une révolution

Un fossé qui se creuse entre calcul et réseau

Drew Perkins pose un constat sans appel : « Le réseau des centres de données IA doit être repensé de fond en comble, car il est différent du réseau des datacenters cloud ».

Le CEO d’Eridu explique que « chaque fois qu’il y a une nouvelle application, un nouveau besoin, les exigences sont différentes. Des puces aux boîtiers, en passant par le système, les logiciels et l’optique, tout doit être repensé pour un type d’application différent ».

La différence fondamentale tient à l’échelle monumentale des infrastructures IA : alors que les datacenters cloud exploitent environ 100 000 serveurs, les centres dédiés à l’IA sont bâtis autour de millions de GPU exigeant une bande passante considérablement supérieure.

Trente ans de stagnation

Drew Perkins dresse un bilan sévère de l’évolution des réseaux : « Le réseau est resté bloqué au même niveau d’amélioration de fois deux tous les deux ans pendant au moins 30 ans, et certainement 20 ans ».

Il poursuit : « Le réseau ne suit pas le rythme du calcul, et cet écart ne cesse de se creuser ». Un retard qui menace directement les performances des systèmes d’intelligence artificielle actuels et futurs.

Les nouvelles architectures IA aggravent la situation

Promode Nedungadi souligne que les tendances architecturales récentes de l’IA, comme les modèles mixtes d’experts ou la désagrégation de l’inférence, amplifient encore les besoins réseau.

« Chacune d’entre elles nécessite le transfert d’un plus grand volume de données », explique-t-il, ajoutant que « la quantité de données transférées par token augmente ».

Le défi se décompose en trois dimensions : la mise à l’échelle pour interconnecter les GPU au sein d’un domaine d’entraînement, l’extension pour structurer des clusters plus larges, et la mise à l’échelle transversale, que Drew Perkins juge « également très intéressante ».

La solution Eridu : l’hyperswitch optique nouvelle génération

Une puce propriétaire révolutionnaire

Au cœur de la stratégie d’Eridu : le développement d’un Asic propriétaire sur mesure. Drew Perkins ne laisse planer aucun doute : « Il ne fait aucun doute que nous développons notre propre puce. C’est le silicium le plus avancé du secteur des réseaux, sans exception, et c’est absolument nécessaire ».

Il justifie cette approche radicale : « Il n’est pas possible d’atteindre une échelle supérieure d’un ordre de grandeur en utilisant une puce disponible dans le commerce ».

Pour concevoir cette puce, Eridu s’est associé à TSMC, le géant taïwanais de la fabrication de semi-conducteurs, pour bénéficier de sa technologie de processus de pointe et de son expertise en intégration de systèmes avancés.

Architecture chiplet et packaging révolutionnaire

Le composant d’Eridu exploitera une architecture basée sur des chiplets avec un packaging avancé, une approche qui permet de dépasser les limites des puces monolithiques traditionnelles.

Omar Hassen explicite cette stratégie : « Nous pensons qu’il faut se démarquer de la technologie dominante » et « par exemple, en matière de packaging avancé, il faut tirer parti de tout ce que l’architecture basée sur les chiplets, la conception à partir d’une feuille blanche et le packaging avancé ont à offrir. Nous pensons être sur la bonne voie technologique pour aller au-delà de ce que font les acteurs existants ».

Cette approche vise une amélioration d’un ordre de grandeur par rapport aux solutions existantes, en contournant les limites architecturales actuelles.

Omar Hassen insiste : « Il faut partir d’un point différent, sinon on risque de se heurter à un plafond si l’on utilise la même architecture que tout le monde ».

Eridu refuse catégoriquement d’assembler simplement des puces de switches existants, approche qui dégraderait la latence en obligeant les paquets à traverser de multiples étapes de stockage intermédiaires.

Bien que non confirmée officiellement, une architecture « waferscale » (puce à l’échelle d’un wafer entier) est fortement suspectée pour cet Asic révolutionnaire.

Un radix ultra-élevé pour une topologie simplifiée

L’Optical Ethernet HyperSwitch d’Eridu affiche un radix exceptionnellement élevé : il peut connecter jusqu’à 5 120 GPU/XPU en single-hop (un seul niveau réseau) et plus d’un million de moteurs de calcul dans une topologie à deux niveaux seulement.

Cette capacité permet d’éliminer les architectures leaf/spine traditionnelles à plusieurs niveaux, réduisant drastiquement la latence et les coûts matériels associés.

Un switch à radix élevé connecte davantage de serveurs directement, ce qui diminue le nombre de sauts intermédiaires nécessaires pour acheminer les données.

Les bénéfices sont multiples : suppression des niveaux intermédiaires, réduction drastique de la latence de bout en bout, diminution du nombre total de switches requis et baisse de la consommation électrique globale.

Concrètement, l’HyperSwitch d’Eridu pourrait réduire le nombre de switches nécessaires par un facteur 30 grâce à son radix suffisamment élevé pour interconnecter 5 120 GPU/XPU en un seul saut.

Cette idée s’inspire directement des switches optiques utilisés dans les réseaux télécom longue distance, technologie éprouvée mais jamais appliquée à cette échelle dans les datacenters.

Ethernet pur avec support des memory fabrics

L’appareil sera 100% Ethernet, tout en supportant les protocoles de memory fabric (équivalents UALink/NVLink) pour les réseaux scale-up, ainsi que les protocoles scale-out classiques.

Cette capacité à gérer deux types d’usage sur un même Asic constitue une différenciation majeure par rapport aux solutions concurrentes actuelles.

Qui sont les clients visés ?

Eridu cible trois catégories de clients : les hyperscalers (géants du cloud comme AWS, Microsoft, Google), les néoclouds (nouveaux acteurs cloud spécialisés dans l’IA) et les opérateurs de clouds locaux.

Ces acteurs sont tous confrontés aux mêmes défis d’interconnexion massive de GPU pour leurs infrastructures d’intelligence artificielle.

S’attaquer aux mastodontes du secteur

Eridu ne craint pas la confrontation : la start-up vise directement des géants comme Broadcom, Cisco, Huawei et Nvidia, qui proposent actuellement des switches optiques 800G pour les datacenters IA.

La jeune entreprise affirme que ces fournisseurs établis n’ont apporté que des améliorations progressives à la même architecture sous-jacente, sans véritable rupture technologique.

Calendrier et prochaines étapes

Pour l’instant, Eridu reste discret sur les spécifications précises du produit et la date de disponibilité générale. Ces informations stratégiques n’ont pas encore été divulguées publiquement.

Des détails techniques supplémentaires ainsi que des annonces de partenariats sont néanmoins prévus pour la fin de l’année 2026, moment où Eridu lèvera progressivement le voile sur sa technologie révolutionnaire.

Laisser un commentaire