loading…
DeepSeek gunakan chip Nvidia. FOTO/ DAILY
Menurut laporan Bloomberg, penyelidikan ini dilakukan di tengah kekhawatiran bahwa model AI terbaru DeepSeek, R1, memiliki performa setara dengan model unggulan dari OpenAI dan Google.
Kecurigaan semakin menguat karena pangsa pendapatan Nvidia dari Singapura meningkat drastis, dari 9% menjadi 22% dalam dua tahun terakhir. Hal ini menimbulkan dugaan bahwa Singapura menjadi jalur alternatif bagi entitas China untuk mendapatkan GPU canggih yang tidak dapat diimpor secara langsung.
DeepSeek belum secara terbuka mengungkapkan jenis perangkat keras yang digunakan untuk melatih model AI R1 mereka.
Namun, sebelumnya mereka menyatakan bahwa model V3 mereka—dengan 671 miliar parameter—dilatih hanya dalam dua bulan menggunakan 2.048 unit GPU Nvidia H800, dengan total penggunaan 2,8 juta jam GPU.
Sebagai perbandingan, Meta membutuhkan 30,8 juta jam GPU untuk melatih model Llama 3 yang memiliki 405 miliar parameter, menggunakan 16.384 unit H100 selama 54 hari.
Efisiensi tinggi dari model R1 menimbulkan spekulasi bahwa DeepSeek menggunakan kluster yang lebih kuat dibandingkan dengan yang digunakan untuk model V3.
Hal ini semakin memperkuat dugaan bahwa perusahaan tersebut memperoleh GPU Nvidia yang terkena pembatasan secara tidak langsung melalui pihak ketiga di Singapura.
(wbs)