DeepSeek V4 memicu perdebatan di Amerika Serikat: Lembaga think tank mengatakan tertinggal setengah tahun karena bergantung pada chip ilegal, CEO Silicon Valley menyebutnya sebagai inovasi terbuka

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan Beating, Dewan Hubungan Luar Negeri Amerika Serikat (CFR) dan peneliti senior terkait China dan teknologi baru di bidang AI, Chris McGuire (mantan anggota Dewan Keamanan Nasional Gedung Putih dan Departemen Pertahanan), menulis bahwa V4 tidak mengubah pola kompetisi AI antara China dan AS. Dia mengutip teks asli laporan V4 yang menyatakan bahwa DeepSeek mengakui kemampuan penalaran mereka “terbelakang sekitar 3 hingga 6 bulan” dibandingkan model-model terdepan, yang merujuk pada GPT-5.2 dan Gemini 3.0 Pro yang dirilis enam bulan lalu. Dia juga mempertanyakan bahwa meskipun laporan V4 mengungkapkan bahwa adaptasi penalaran menggunakan GPU NVIDIA dan NPU Huawei Ascend, mereka tidak mempublikasikan model GPU spesifik dan biaya yang digunakan untuk pelatihan (V3 pernah mengklaim menggunakan 2000 unit H800 dengan biaya 5,57 juta dolar), dan menganggap keheningan tersebut menunjukkan penggunaan chip NVIDIA Blackwell yang dikendalikan ekspor. Sebelumnya, pejabat pemerintah AS pernah secara anonim menyampaikan hal serupa pada bulan Februari, yang kemudian ditolak oleh NVIDIA sebagai “tidak masuk akal”; DeepSeek membantah menggunakan Blackwell dan menyatakan bahwa model dilatih pada NVIDIA H800 dan Huawei Ascend 910C.

CEO Replit, Amjad Masad, menanggapi secara tegas, menyatakan bahwa politisi dan lobi AS yang memicu kepanikan tentang “distilasi China” sedang mengabaikan bahwa ilmuwan China secara terbuka berbagi terobosan AI yang nyata. Dia mengutip inovasi struktural yang tercantum dalam tweet resmi DeepSeek, termasuk kompresi perhatian tingkat token (DeepSeek Sparse Attention) dan peningkatan efisiensi perhitungan konteks panjang secara signifikan, menunjukkan bahwa kemampuan penalaran per token dan penggunaan cache KV pada V4-Pro saat konteks 1 juta token jauh lebih rendah dibandingkan V3.2. Masad berpendapat bahwa inovasi arsitektur semacam ini sama sekali tidak terkait dengan distilasi data pelatihan, dan semua orang dapat memperoleh manfaat dari sumber terbuka, termasuk laboratorium-laboratorium di AS.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan