Jakarta (Lampost.co)–– Perusahaan rintisan kecerdasan buatan asal Tiongkok, DeepSeek, mengungkap secara publik pendekatan teknis mereka dalam melatih model AI open source.
Hal ini dinilai jauh lebih efisien dan murah dari pada kompetitornya seperti OpenAI. Informasi ini terungkap langsung oleh pendiri DeepSeek, Liang Wenfeng, dalam laporan yang dikutip dari South China Morning Post (SCMP).
Latih DeepSeek-V3 dengan 2.048 GPU H800
Dalam laporannya, Liang mengungkap bahwa DeepSeek-V3 terlatih menggunakan 2.048 GPU Nvidia H800. Sebuah jenis chip yang memang merancang khusus untuk pasar China sebagai respons terhadap pembatasan ekspor GPU dari Amerika Serikat.
Baca juga: OpenAI Luncurkan Fitur Memori Baru di ChatGPT, Bisa ingat Obrolan Pengguna Sebelumnya
“DeepSeek-V3 yang terlatih menggunakan 2.048 GPU Nvidia H800 memperlihatkan bagaimana model hardware bisa mengubah tantangan ini secara efektif. Membuat pelatihan dan inference dalam skala menjadi efisien,” tulis Liang.
GPU H800 ini sebelumnya sempat ditimbun oleh DeepSeek bersama investor utamanya, High-Flyer Capital. Sebelum akhirnya ekspor GPU jenis ini juga dilarang pada 2023 oleh pemerintah AS.
Efisiensi Tinggi, Biaya Lebih Rendah dari OpenAI
DeepSeek menggunakan metode pelatihan yang lebih hemat biaya, dan mengklaim bisa menandingi performa model besar seperti GPT dari OpenAI. Namun dengan konsumsi sumber daya yang jauh lebih sedikit. Strategi teknis yang mengadopsi meliputi:
Optimasi memori GPU
Peningkatan komunikasi antar chip efisiensi infrastruktur AI secara keseluruhan.
Pendekatan ini berhasil menurunkan biaya komputasional untuk prapelatihan (pretraining). Serta meningkatkan kecepatan inference, atau proses ketika model menghasilkan respons dari input pengguna.
Efisiensi DeepSeek dalam membangun model AI membuat pendekatannya mengadopsi oleh banyak pengembang AI lain di China. Termasuk oleh raksasa teknologi seperti Alibaba, yang menggunakan teknik serupa dalam pengembangan model Qwen3.
DeepSeek sendiri merilis DeepSeek-V3 pada Desember 2024, menyusul oleh model DeepSeek-R1 pada Januari 2025.
Keduanya mengejutkan komunitas AI global karena berhasil menawarkan kualitas sebanding GPT. Namun dengan konsumsi komputasi yang jauh lebih rendah.
Persaingan Semakin Ketat di Dunia Model AI Open Source China
Setelah perilisan V3 dan R1.
DeepSeek tampak lebih tertutup terkait roadmap pengembangan selanjutnya. Meski demikian, mereka masih merilis hasil penelitian secara reguler ke publik.
Di tengah ketertutupan itu, para pesaing lokal DeepSeek di China justru tancap gas. Beberapa perkembangan terbaru:
Baidu merilis Ernie 4.5 Turbo dan X1 Turbo pada April 2025, menawarkan kemampuan reasoning multimodal dengan harga 40% lebih murah dari DeepSeek-V3.
Alibaba meluncurkan versi terbaru dari model AI Qwen, yang dalam waktu singkat berhasil menyalip V3 sebagai model open source paling populer di dunia.
AI Open Source China Semakin Menggila
Dominasi China dalam pengembangan AI open source yang efisien dan murah kini terlihat semakin nyata. Dengan pendekatan pragmatis, efisien, dan terukur, DeepSeek dan para pesaingnya mendorong revolusi AI dengan biaya rendah namun performa tinggi. Menghadirkan tantangan besar bagi model-model buatan Barat seperti GPT milik OpenAI.








