Acheter Cryptos

Payer en

USD

Acheter & Vendre

Visa, Mastercard, SEPA et bien plus

Trading flexible, zéro frais

Payez partout avec vos cryptos

Basique

Échangez des cryptos librement

Augmentez vos bénéfices grâce à l'effet de levier

Convertir & Auto-investir

Tradez n’importe quel volume sans frais ni slippage

Soyez facilement exposé à des positions à effet de levier

Trading Pre-Market

Tradez de nouveaux tokens avant le listing

Avancé

Effectuez des transactions on-chain avec Gate Wallet

Accès aux nouveaux tokens on-chain

Stratégies de trading automatisées

Suivez les experts

CrossEx Trading

Un seul solde de marge, partagé par toutes les plateformes

Accédez à des centaines de contrats perpétuels

Une plateforme pour les actifs mondiaux

Tradez des options classiques de style européen

Maximiser l'efficacité de votre capital

Introduction au trading futures

Préparez-vous à trader des contrats futurs

Événements futures

Participez aux événements et gagnez

Utiliser des fonds virtuels pour faire l'expérience du trading sans risque

Lancer

Collecte des candies pour obtenir des airdrops

Staking rapide, Gagnez de potentiels nouveaux jetons

Conservez des GT et recevez d'énormes airdrops gratuitement

Accédez à l'intégralité des introductions en bourse mondiales

Tradez on-chain et gagnez des airdrops

Gagnez des points Futures et réclamez vos récompenses d’airdrop.

Investissement

Gagner des intérêts avec des jetons inutilisés

Investissement automatique

Auto-invest régulier

Double investissement

Profitez de la volatilité du marché

Gagnez des récompenses grâce au staking flexible

Mettre en gage un crypto pour en emprunter une autre

Centre de prêts

Centre de prêts intégré

Gestion de patrimoine VIP

Plans premium de croissance

Gestion privée de patrimoine

Allocation premium d'actifs

Stratégies quantitatives

Stakez des cryptos pour gagner avec les produits PoS.

Effet de levier sans liquidation

Mint des GUSD pour des rendements RWA

Découvrir la valeur en crypto

Analyse en temps réel du marché des cryptomonnaies

Discutez avec des traders de cryptomonnaies

Ce qu'il se passe dans le monde de la crypto

Plus

Promotions

Centre d'activités

Participez et gagnez des récompenses

Invitez des amis et gagnez des récompenses

Programme d'affiliation

Obtenez des commissions exclusives

Développez votre influence et gagnez des airdrops

Mises à jour en temps réel

Articles sur le secteur de la crypto

Frais ultra-réduits

Gestion des actifs

Solution complète de gestion des actifs

Solutions d’actifs pour entreprises

Virement Bancaire OTC

Dépôt et retrait fiat

Programme pour les Brokers

Mécanismes de remboursement API avantageux

AI

Votre assistant IA polyvalent pour toutes vos conversations

Utilisez Gate AI directement dans votre application sociale

Gate Blue Lobster, prêt à l’emploi

Gate for AI Agent

Infrastructure IA, Gate MCP, Skills et CLI

Gate Skills Hub

+10K compétences

De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA

Choisissez intelligemment parmi plus de 30 modèles d’IA, avec 0 % de frais supplémentaires

Autres

Trouver des FAQ et des guides d'aide

Apprenez à investir dans les cryptomonnaies

Grandir avec les champions

Preuve de réserves

Gate promet une preuve de réserves à 100 %

Assurez la sécurité de vos actifs

LightningClicker

2026-04-24 23:07:20

J'ai trouvé cette histoire de NVIDIA avec Groq vraiment intéressante.

En gros, ce que Huang Renxun a expliqué maintenant a beaucoup de sens stratégique.

Tout a commencé parce que le marché de l'inférence a changé.
Avant, tout le monde se concentrait sur une seule chose : augmenter le débit, traiter plus de requêtes en même temps.
Mais ensuite, les gens ont réalisé que ce n'est pas toujours comme ça en pratique.
Certains utilisateurs sont prêts à payer plus cher pour des réponses plus rapides, indépendamment du volume total.

C'est comme ça : vous avez deux modèles identiques, mais l'un répond en 50ms et l'autre en 500ms.
Si vous êtes un ingénieur développant une application en temps réel, combien paieriez-vous en plus pour celui qui est 10 fois plus rapide ?
Exactement, ce marché de la faible latence est totalement différent de celui du débit élevé.

Et là, Groq intervient dans cette histoire.
L'architecture LPU qu'ils ont est justement spécialisée dans ce domaine, avec une faible latence déterministe.
Tandis que les GPU de NVIDIA dominent le côté du débit massif, Groq comble un vide complètement différent.
Quand on regarde le Groq 3 LPU sorti en mars, fabriqué en 4nm par Samsung, la capacité d'inférence par mégawatt dans des modèles trilionaires est 35 fois meilleure que le Blackwell NVL72.
Ce n'est pas une petite différence.

Ce que Huang dit essentiellement, c'est que NVIDIA a compris qu'il n'existe pas un seul marché de l'inférence, mais deux segments très distincts avec des dynamiques de tarification complètement différentes.
Vous pouvez avoir un débit moindre, mais si le prix unitaire par token est beaucoup plus élevé, cela vaut le coup.
C'est comme étendre la frontière de Pareto du marché.

C'était une stratégie bien pensée de NVIDIA, en réalité.
Ils ont reconnu une lacune et sont allés la combler.
Jonathan Ross et l'équipe de Groq continuent d'opérer de manière indépendante, mais maintenant avec tout le poids de NVIDIA derrière eux.
Il semble que quelqu'un pense enfin à l'inférence de manière plus sophistiquée.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
WCTCTradingKingPK
198.09K Popularité
#
CryptoMarketSeesVolatility
258.18K Popularité
#
IsraelStrikesIranBTCPlunges
32.39K Popularité
#
rsETHAttackUpdate
86.02K Popularité
#
US-IranTalksStall
354.69K Popularité

Épingler