あなたはNVIDIAの非常に興味深い戦略に気づきましたか?彼らはGroqの推論チップ事業を2000億ドルで買収し、今やそれを行った理由がより明確になり始めています。



私の注意を引いたのは、黄仁勲(Huang Renxun)がこの買収の背後にあるロジックについて説明した部分です。基本的に、推論市場はセグメント化しつつあります。以前は、皆が一つのことに集中していました:スループットを増やすこと。しかし、その後、トークンの商業的価値が大きく変わり、異なるユーザーが応答速度に応じて異なる価格を支払う意欲を持つようになったのです。

これはつまり、エンジニアにより速い応答を提供できるなら、彼らはそのためにより多く支払う意欲があるということです。そして、低遅延の需要は市場では比較的新しいものです。

そこにGroqが登場します。彼らのLPUアーキテクチャは、決定論的な低遅延で知られており、これはNVIDIAのGPUの高スループットアプローチを完璧に補完します。4nmでリリースされたGroq 3 LPUは、兆のパラメータを持つモデルの1メガワットあたりの推論能力が、Blackwell NVL72の35倍であることを示しました。これは決して小さなことではありません。

つまり、NVIDIAは自社の製品ラインにおいて重要なギャップを埋めたのです。今や、高スループットセグメントと低遅延・高単価セグメントの両方をカバーしています。いわゆるパレート拡張です。応答時間に応じて価格が異なる同じモデル。スループットは低くても、単価がそれを補います。

これが戦略です:競争ではなく、補完です。そして、AI市場の進化を考えると、非常に理にかなっています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン