NVIDIA 在 2026 年 3 月 11 日推出了重大突破,發布了 Nemotron 3 Super——一款擁有 1200 億參數的開源模型,專為代理 AI 工作負載而設計。該系統承諾比前一代產品的吞吐量提升五倍,直接解決了現代企業環境中部署的多代理 AI 系統所面臨的基礎設施瓶頸。
此次發布標誌著快速擴展的代理 AI 市場的關鍵時刻。各組織發現,在其運營中部署先進的 AI 代理——無論是用於代碼生成、金融分析還是製造自動化——都帶來了傳統語言模型從未遇到的計算和財務挑戰。企業團隊已經開始將 Nemotron 3 Super 集成到其生產系統中,彰顯對該模型能夠推動下一代工作場所 AI 的信心。
為何多代理 AI 系統需要不同的解決方案
Nemotron 3 Super 解決的核心問題並不新穎,但在大規模部署代理 AI 時變得至關重要。傳統的聊天機器人會獨立處理每次對話。而多代理工作流程則必須在每次交互中不斷重新傳送整個對話歷史、工具執行輸出和推理鏈。這種架構需求導致令牌生成量激增——比單一代理聊天機器人高出多達 15 倍,推理成本迅速上升。
除了原始的令牌數量外,還有 NVIDIA 所稱的「思考稅」:代理 AI 系統在推理哪些工具、如何排序它們以及是否需要重新審視先前決策時的計算開銷。這些元操作增加了層層處理,簡單的語言模型推理從未需要。
傳統的解決方案——將碎片化的對話分開處理——迫使 AI 代理在不完整的上下文中重新推理。審查監管文件的金融分析師失去了連貫性。軟體開發代理無法在活動記憶中持有整個代碼庫。生產力和成本效率都受到影響。
架構突破:使代理 AI 在計算上可行
Nemotron 3 Super 通過架構創新解決了這兩個問題。一個一百萬令牌的上下文窗口,使代理 AI 系統能夠在工作記憶中維持整個工作流程狀態。一個軟體開發代理可以一次性載入完整的代碼庫。金融分析系統則能處理數千頁報告,而不會將推理拆分成多次推理調用。
企業反應迅速。Perplexity 將 Nemotron 3 Super 集成到其搜索平台,並在一個由 20 個模型組成的代理 AI 任務協調系統中部署。專門的 AI 編碼平台——CodeRabbit、Factory 和 Greptile——將該模型嵌入其 AI 驅動的開發代理中,用於實時代碼審查和生成。
重工業部署也在不同渠道進行。西門子、達索系統和 Cadence 正利用 Nemotron 3 Super 進行製造自動化和半導體設計流程——這些領域的代理 AI 能帶來顯著的效率提升。Palantir 將該模型應用於網絡安全代理 AI 系統,而 Amdocs 則用於電信基礎設施自動化。
NVIDIA 決定以寬鬆許可證釋出 Nemotron 3 Super 的開源權重,標誌著公司市場策略的轉變。NVIDIA 不再限制代理 AI 基礎設施的存取,而是廣泛推動採用。此次發布包含超過 10 兆令牌的訓練數據和 15 個強化學習環境——這些資源在競爭對手中通常是專有的。
模型的表現驗證了這一策略。Nemotron 3 Super 在人工分析效率排行榜中名列前茅。由此模型驅動的 NVIDIA AI-Q 研究代理,在專為衡量多步驟代理 AI 在大量文件集中的推理能力而設的 DeepResearch Bench 排行榜上均獲得第一名。
對 NVIDIA 來說,真正的戰略考量集中在 Blackwell。隨著企業將代理 AI 標準化用於內部運營,對運行這些系統所需專用硬體的持續需求形成良性循環。2026 年的日曆將揭示這些代理 AI 整合是否推動了 Blackwell 芯片的持久採用,進一步鞏固 NVIDIA 作為企業級代理 AI 部署基礎架構層的地位。
NVIDIA 的 Nemotron 3 Super 重塑企業代理 AI 部署
NVIDIA 在 2026 年 3 月 11 日推出了重大突破,發布了 Nemotron 3 Super——一款擁有 1200 億參數的開源模型,專為代理 AI 工作負載而設計。該系統承諾比前一代產品的吞吐量提升五倍,直接解決了現代企業環境中部署的多代理 AI 系統所面臨的基礎設施瓶頸。
此次發布標誌著快速擴展的代理 AI 市場的關鍵時刻。各組織發現,在其運營中部署先進的 AI 代理——無論是用於代碼生成、金融分析還是製造自動化——都帶來了傳統語言模型從未遇到的計算和財務挑戰。企業團隊已經開始將 Nemotron 3 Super 集成到其生產系統中,彰顯對該模型能夠推動下一代工作場所 AI 的信心。
為何多代理 AI 系統需要不同的解決方案
Nemotron 3 Super 解決的核心問題並不新穎,但在大規模部署代理 AI 時變得至關重要。傳統的聊天機器人會獨立處理每次對話。而多代理工作流程則必須在每次交互中不斷重新傳送整個對話歷史、工具執行輸出和推理鏈。這種架構需求導致令牌生成量激增——比單一代理聊天機器人高出多達 15 倍,推理成本迅速上升。
除了原始的令牌數量外,還有 NVIDIA 所稱的「思考稅」:代理 AI 系統在推理哪些工具、如何排序它們以及是否需要重新審視先前決策時的計算開銷。這些元操作增加了層層處理,簡單的語言模型推理從未需要。
傳統的解決方案——將碎片化的對話分開處理——迫使 AI 代理在不完整的上下文中重新推理。審查監管文件的金融分析師失去了連貫性。軟體開發代理無法在活動記憶中持有整個代碼庫。生產力和成本效率都受到影響。
架構突破:使代理 AI 在計算上可行
Nemotron 3 Super 通過架構創新解決了這兩個問題。一個一百萬令牌的上下文窗口,使代理 AI 系統能夠在工作記憶中維持整個工作流程狀態。一個軟體開發代理可以一次性載入完整的代碼庫。金融分析系統則能處理數千頁報告,而不會將推理拆分成多次推理調用。
該模型採用混合專家模型設計,在推理過程中僅激活 120 億參數中的 12 億參數,儘管整體參數數量達到 1200 億。NVIDIA 的專有 Latent MoE 技術能激活四個專門的專家模塊,且計算成本與單一專家相同。結合多令牌預測——同時生成多個詞語——該架構實現了比傳統方法快 3 倍的推理速度。
硬體優化同樣重要。在 Blackwell 基礎設施上運行,使用 NVFP4 精度,推理速度比上一代 Hopper 的 FP8 快 4 倍(根據 NVIDIA 的基準測試),且不影響準確性。對於持續運行代理 AI 工作負載的企業來說,這種效率直接轉化為資本和運營成本的降低。
代理 AI 在各行各業的應用加速
企業反應迅速。Perplexity 將 Nemotron 3 Super 集成到其搜索平台,並在一個由 20 個模型組成的代理 AI 任務協調系統中部署。專門的 AI 編碼平台——CodeRabbit、Factory 和 Greptile——將該模型嵌入其 AI 驅動的開發代理中,用於實時代碼審查和生成。
重工業部署也在不同渠道進行。西門子、達索系統和 Cadence 正利用 Nemotron 3 Super 進行製造自動化和半導體設計流程——這些領域的代理 AI 能帶來顯著的效率提升。Palantir 將該模型應用於網絡安全代理 AI 系統,而 Amdocs 則用於電信基礎設施自動化。
雲端可及性消除了部署障礙。Google Cloud 的 Vertex AI 和 Oracle Cloud Infrastructure 已提供 Nemotron 3 Super,亞馬遜 Bedrock 和微軟 Azure 也即將加入支持。推理服務提供商如 Fireworks AI、DeepInfra 和 Cloudflare 已經在提供該模型,開發者可以在不自行管理基礎設施的情況下使用代理 AI 功能。
開源策略與市場定位
NVIDIA 決定以寬鬆許可證釋出 Nemotron 3 Super 的開源權重,標誌著公司市場策略的轉變。NVIDIA 不再限制代理 AI 基礎設施的存取,而是廣泛推動採用。此次發布包含超過 10 兆令牌的訓練數據和 15 個強化學習環境——這些資源在競爭對手中通常是專有的。
模型的表現驗證了這一策略。Nemotron 3 Super 在人工分析效率排行榜中名列前茅。由此模型驅動的 NVIDIA AI-Q 研究代理,在專為衡量多步驟代理 AI 在大量文件集中的推理能力而設的 DeepResearch Bench 排行榜上均獲得第一名。
對 NVIDIA 來說,真正的戰略考量集中在 Blackwell。隨著企業將代理 AI 標準化用於內部運營,對運行這些系統所需專用硬體的持續需求形成良性循環。2026 年的日曆將揭示這些代理 AI 整合是否推動了 Blackwell 芯片的持久採用,進一步鞏固 NVIDIA 作為企業級代理 AI 部署基礎架構層的地位。