Bandar Lampung (Lampost.co) — Persaingan teknologi AI kembali memanas. Kali ini, NVIDIA menunjukkan taringnya lewat hasil benchmark terbaru yang cukup mencolok.
Dalam ajang MLPerf Inference v6.0, NVIDIA mencatat performa tinggi sekaligus efisiensi biaya yang lebih baik—kombinasi yang selama ini jadi incaran industri AI global.
Strategi “Extreme Co-Design” Jadi Kunci
Keunggulan ini tidak datang begitu saja. NVIDIA mengandalkan pendekatan yang mereka sebut extreme co-design—yakni integrasi penuh antara:
- Perangkat keras (hardware)
- Perangkat lunak (software)
- Model AI
Pendekatan ini memungkinkan semua komponen bekerja selaras, sehingga performa meningkat tanpa harus mengorbankan efisiensi.
GPU Blackwell Ultra Tampil Mendominasi
Sorotan utama ada pada GPU generasi terbaru, Blackwell Ultra.
Dalam berbagai skenario pengujian, GPU ini mencatat:
- Throughput tinggi di berbagai model AI
- Kinerja unggul dalam beban kerja kompleks
- Efisiensi pemrosesan token yang lebih baik
Tak heran jika NVIDIA kini telah mengoleksi 291 kemenangan MLPerf sejak 2018, jauh melampaui gabungan pesaingnya.
Didukung Raksasa Teknologi Dunia
Dominasi ini juga diperkuat oleh dukungan mitra besar. Sejumlah perusahaan seperti Google Cloud, Dell, Cisco, Lenovo, hingga Supermicro ikut mengajukan hasil berbasis platform NVIDIA.
Ini menjadi partisipasi terbesar sepanjang sejarah MLPerf, menandakan ekosistem NVIDIA semakin kuat.
Benchmark Baru, Tantangan Lebih Kompleks
MLPerf kali ini juga menghadirkan berbagai benchmark baru yang lebih realistis dan kompleks, seperti:
- Model interaktif berbasis AI
- AI multimodal (teks + gambar)
- Model reasoning berbasis LLM
- Generatif teks ke video
Artinya, pengujian tidak lagi sekadar soal kecepatan, tapi juga kemampuan AI dalam memahami dan menghasilkan konten kompleks.
Lonjakan Performa dan Efisiensi
Salah satu hasil paling mencolok datang dari sistem GB300 NVL72, yang mencatat:
- 2,7x peningkatan throughput token
- Penurunan biaya token lebih dari 60%
Peningkatan ini didorong oleh optimasi software seperti:
- TensorRT-LLM
- Dynamo
Keduanya menghadirkan fitur baru yang membuat pemrosesan AI jauh lebih efisien.
Skala Besar, Performa Maksimal
NVIDIA juga menunjukkan kemampuan scale-out dengan menghubungkan beberapa sistem sekaligus menggunakan teknologi jaringan canggih.
Hasilnya:
- Ratusan GPU bekerja bersamaan
- Jutaan token diproses setiap detik
Ini menjadi salah satu pengujian terbesar dalam sejarah MLPerf.
Menuju Standar Baru AI Dunia Nyata
Ke depan, NVIDIA bersama MLCommons tengah mengembangkan standar baru bernama MLPerf Endpoints.
Berbeda dari sebelumnya, benchmark ini akan:
- Mengukur performa berbasis trafik API
- Lebih mendekati kondisi penggunaan nyata
Langkah ini menunjukkan bahwa industri AI mulai bergerak dari sekadar angka performa ke pengalaman penggunaan sesungguhnya.
AI Tidak Lagi Sekadar Cepat, Tapi Juga Efisien
Pencapaian ini menegaskan satu hal penting: masa depan AI tidak hanya soal kecepatan, tapi juga efisiensi dan skalabilitas.
Dan untuk saat ini, NVIDIA tampaknya masih selangkah di depan dalam perlombaan tersebut.








