AltcoinArchitect
vip

Certaines organisations (SGLang) atteignent désormais 7 583 jetons par seconde par GPU exécutant un certain modèle d'IA R1 sur le GB200 NVL72, un bond de 2,7x par rapport au H100.



Nous sommes ravis de voir l'écosystème open source faire progresser les optimisations d'inférence sur GB200 NVL72, réduisant le coût par jeton pour l'industrie à
Voir l'original
post-image
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
  • Récompense
  • 8
  • Partager
Commentaire
0/400
AltcoinHuntervip
· 06-19 17:03
Faites-le chauffer, faites-le chauffer ! Augmentation de 2,7 fois, pas encore lancé.
Répondre0
CryptoPunstervip
· 06-18 08:09
La guerre matérielle tue à l'avenir le marché noir.
Répondre0
LiquidityWizardvip
· 06-17 07:19
*théoriquement* multiplier l'efficacité par 2,7x signifie -63% de coût de base... fascinant
Répondre0
DeFiDoctorvip
· 06-17 01:31
Le mode d'amplification numérique est douteux, il est conseillé de revoir le groupe de contrôle.
Répondre0
TokenAlchemistvip
· 06-17 01:16
meh, les tps bruts ne signifient pas une extraction optimale du mev à vrai dire
Répondre0
GasWhisperervip
· 06-17 01:16
ces métriques de tps coulent comme des vagues de mempool fluides rn
Répondre0
ProposalManiacvip
· 06-17 01:15
C'est encore Nvidia, je n'ai pas assez de points.
Répondre0
HodlKumamonvip
· 06-17 01:09
Eh bien, c'est puissant ww petit expert en puissance de calcul.
Répondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)