你現在擁有全球最快的 $NBIS 計算推理嗎?


Nebius 以現金和股票收購 Eigen AI,將 Eigen 的推理能力和訓後優化直接帶入 Nebius 的代碼工廠
在 NVIDIA 的 GTC 2026 主要演講中,Eigen AI 在 Kimi K2.5 Reasoning 的輸出速度中排名第一,而 Nebius Fast 幾乎追平
同時,Nebius Fast 在 $NVDA 設備上針對開源模型 ChatGPT,gpt-oss-120B 的推理速度也位居第一
此外,Eigen 在 Artificial Analysis 上以 25 個開源模型為基準,排在 GPU 供應商之首,排除 ASIC 供應商,使用預設輸入設置 10K。它也是 Qwen3 Coder 480B 的最快供應商,速度為 255.8 T/秒,超越 Google Vertex 的 169.2 T/秒 和 Amazon 的 121.3 T/秒
這意味著 Eigen 的速度比 Google Vertex 快約 51%,是 Amazon 的兩倍多
━━━━━━━━━━━━━━━━━━━━
儘管收購成本似乎很高,但如果 Eigen 真能略微提升 $643M 的推理性能,長遠來看將對利潤和競爭地位產生複合影響,甚至可能彌補其成本
━━━━━━━━━━━━━━━━━━━━
Nebius 擁有 GPU 雲端資源,而 Eigen 則在提升這些 GPU 的符號生成效率。 在相同的 NVIDIA 設備上,性能不僅取決於資本支出。它還涉及 GPU 的使用、模型優化、聚合、延遲、記憶體管理和專用核心
Eigen 的技術堆疊專注於量化、KV 快取優化、差分、推理解碼、CUDA 和 Triton 專用核心、持續聚合和運行時間優化
如果 Nebius 能在相同的 NVIDIA 設備上產生更高的推理速度,這將提升收入能力、每個符號的成本和毛利率,而無需相應增加資本支出
$NVDA 正在邁向年收入數十億的公司,這意味著即使是少數幾個百分點的推理性能提升,也能轉化為數億美元的節省
━━━━━━━━━━━━━━━━━━━━
開源模型正快速進步。Kimi、Qwen、DeepSeek、GLM、Llama、Nemotron、MiniMax 及其他模型都需要持續改進以保持競爭力
通過整合 Eigen,Nebius 也能更快推出改進版本,並使代碼工廠對開發者和企業客戶更具吸引力$NBIS
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆