Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 30+ model AI, dengan 0% biaya tambahan
Peneliti DeepMind menduga alasan penundaan DeepSeek V4: data pelatihan yang dua kali lipat menjadi 33T menyebabkan ketidakstabilan yang parah
Menurut pemantauan Beating, laporan teknologi DeepSeek V4 mengungkapkan bahwa V4-Flash dan V4-Pro masing-masing melakukan pra-pelatihan pada 32T dan 33T token, yang merupakan dua kali lipat dari sekitar 15T token pada V3.
Laporan mengakui bahwa selama proses pelatihan, “menghadapi tantangan ketidakstabilan yang signifikan”, lonjakan loss (peningkatan mendadak dalam kerugian pelatihan) muncul berulang kali, dan akar penyebabnya adalah nilai ekstrem pada lapisan MoE, mekanisme routing itu sendiri juga akan memperburuk nilai ekstrem ini, rollback sederhana tidak dapat menyelesaikan masalah secara menyeluruh.
DeepSeek menemukan dua solusi dan telah menerapkannya dalam pelatihan nyata: Anticipatory Routing (routing antisipatif), memisahkan perhitungan indeks routing dari pembaruan jaringan utama, hanya secara otomatis memicu saat terdeteksi lonjakan loss, dengan biaya tambahan sekitar 20%; SwiGLU Clamping, membatasi nilai aktivasi ke rentang tetap untuk langsung menekan nilai ekstrem.
Laporan menyatakan kedua metode tersebut efektif, tetapi mengakui bahwa “prinsip dasar belum sepenuhnya dipahami”.
Peneliti Google DeepMind Susan Zhang (yang pernah bekerja di Meta AI dan OpenAI) berkomentar bahwa ketidakstabilan yang dipicu oleh penggandaan data pelatihan “menjelaskan penundaan”, dan menggambarkan kedua solusi ini sebagai “plester luka”, sekaligus memuji transparansi teknologi DeepSeek.