Gate News 訊息,4 月 23 日 — DeepSeek 已在 MIT 許可證下開源 TileKernels,這是一個以 TileLang 編寫的 GPU kernel 庫,用於大型語言模型的訓練與推理。TileLang 是 tile-ai 團隊所開發的領域特定語言,用於在 Python 中表達高效能的 GPU kernel。DeepSeek 表示,該程式庫中的多數 kernel 已接近在運算密度與記憶體頻寬方面的硬體效能上限,其中部分已部署於內部的訓練與推理作業。
該程式庫包含六類 kernel:MoE (專家混合) 的 gating 與路由,包括 Top-k 專家選擇、token-to-expert 對映,以及帶權重正規化的融合 expand/shrink;支援量化的格式包含 FP8、FP4 與 E5M6,並提供逐 token、逐區塊與逐通道的量化,包含融合的 SwiGLU+量化運算;batch transpose;Engram gating,並融合 RMSNorm 前向/反向傳播與權重梯度歸約;Manifold HyperConnection,採用 Sinkhorn 正規化與混合的 split/apply;以及高階 autograd 介面,將低階 kernel 封裝為可訓練層。
Engram 與 Manifold HyperConnection 是 DeepSeek 模型架構的專有元件,實作細節首次向公眾公開。該程式庫需要 NVIDIA SM90 或 SM100 架構的 GPU (H100/H200 或 Blackwell 系列)、CUDA Toolkit 13.1 或更高版本,以及 PyTorch 2.10 或更高版本。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Upbit 推出以太坊 Layer 2 GIWA 鏈,並提供 Optimism 支援
根據週一的一份公告,南韓最大的加密貨幣交易所 Upbit 已與 Optimism 合作,使用 OP Stack 技術打造一條新的以太坊 Layer 2 區塊鏈。GIWA Chain 將會是首條在 OP Enterprise 的自主管理(Self-Managed)層級上啟動的區塊鏈,這意味著 Upbit 將
Crypto Frontier47分鐘前
Tetra Trust 推出 CADD 穩定幣,提供 7/24 結算服務
Tetra Trust 已推出 CADD,一款為機構使用而設計的新型穩定幣,目的在於支援 24/7 的跨境清算,以及即時的企業金庫運作。該穩定幣獲 Shopify 與加拿大國家銀行等眾多支持者背書。CADD 旨在取代過去的批次式清算系統,w
Crypto Frontier1小時前
DTCC 將於 2026 年 7 月推出代幣化資產服務
## DTCC 宣布代幣化服務推進
根據 DT 的一份聲明,DTCC(Depository Trust & Clearing Corporation)週一表示,它將在 2026 年 7 月協助進行代幣化真實世界資產的初始、有限的量產交易,並在 2026 年 10 月於服務全面啟動前先行推出。
Crypto Frontier2小時前
Exodus 在付款轉型上達到「關鍵門檻」:基準
基準分析師 Mark Palmer 表示 Exodus Movement 在從自我託管錢包提供商轉型為加密貨幣支付平台之際,已跨過所謂「關鍵門檻」,並在週一的備忘錄中重申其 Buy 評等與 21 美元的目標價——這代表其目前價格出現約 165% 的漲幅,從
Crypto Frontier2小時前
AequiSolva 於 4 月 30 日推出 Sentinel Stack AI 架構,用於機構級資產驗證
根據 AequiSolva 的說法,公司於 2026 年 4 月 30 日推出其整合 AI 的 Sentinel Stack™ 交易所架構,具備確定性執行、由 AI 驅動的市場監測,以及用於持續加密「儲備證明」的 Omni-Attest Engine™。該平台結合三個核心
GateNews4小時前