NVIDIA Rilis AI Multimodal Baru, Satu Model Bisa Baca Teks hingga Video

NVIDIA juga menekankan pendekatan terbuka untuk pengembang.

Editor Denny
Rabu, 06 Mei 2026 16.45 WIB
NVIDIA Rilis AI Multimodal Baru, Satu Model Bisa Baca Teks hingga Video
nemotron 3 nano omni

Bandar Lampung (Lampost.co) — Perusahaan teknologi NVIDIA kembali mendorong batas pengembangan kecerdasan buatan dengan memperkenalkan Nemotron 3 Nano Omni, model AI terbaru yang dirancang untuk menangani berbagai jenis data dalam satu sistem.

Berbeda dari model AI konvensional yang biasanya fokus pada satu jenis input, teknologi ini mampu memproses teks, gambar, audio, hingga video secara bersamaan.

Dirancang untuk Era AI Agentic

Nemotron 3 Nano Omni dikembangkan untuk mendukung konsep agentic AI—yakni sistem kecerdasan buatan yang dapat bertindak sebagai “agen” dan menjalankan tugas kompleks secara mandiri.

Kemampuannya mencakup:

  • Menavigasi antarmuka komputer
  • Membaca dan menganalisis dokumen
  • Memahami konten visual dan audio
  • Menggabungkan berbagai informasi dalam satu alur kerja

Dengan pendekatan ini, AI tidak lagi sekadar alat bantu, tetapi mulai berperan sebagai eksekutor tugas.

Klaim Lebih Efisien hingga 9 Kali Lipat

Salah satu sorotan utama dari model ini adalah efisiensinya.

  • Diklaim hingga 9x lebih efisien dibanding model terbuka sejenis
  • Tetap menjaga akurasi tinggi dalam pemrosesan data
  • Mampu menekan biaya operasional untuk penggunaan skala besar

Selain itu, model ini juga disebut unggul dalam berbagai pengujian, termasuk pemahaman dokumen dan analisis audio-visual.

Arsitektur Canggih dan Konteks Lebar

Secara teknis, Nemotron 3 Nano Omni dibangun dengan pendekatan yang cukup kompleks.

Beberapa teknologi yang digunakan:

  • Arsitektur 30B-A3B hybrid mixture-of-experts (MoE)
  • Dukungan konteks hingga 256K
  • Teknologi Conv3D dan EVS untuk pemrosesan multimodal

Kombinasi ini memungkinkan AI memahami data dalam skala besar dan konteks yang lebih panjang.

Sudah Digunakan Sejumlah Perusahaan Global

Sejumlah perusahaan telah mulai mengadopsi teknologi ini sebagai bagian dari sistem mereka.

Pengguna awal:

  • Foxconn
  • Palantir Technologies
  • Dell Technologies
  • Oracle Corporation

Selain itu, beberapa perusahaan lain masih dalam tahap evaluasi untuk implementasi lebih lanjut.

Penggunaan Lokal hingga Cloud

Fleksibilitas juga menjadi salah satu keunggulan model ini.

Menjalankan Nemotron 3 Nano Omni dapat di berbagai lingkungan:

  • Perangkat lokal (on-device)
  • Pusat data (data center)
  • Infrastruktur cloud

Model ini sudah tersedia sejak 28 April 2026 melalui berbagai platform seperti Hugging Face dan layanan resmi NVIDIA.

Ekosistem Terbuka Jadi Daya Tarik

NVIDIA juga menekankan pendekatan terbuka untuk pengembang.

Beberapa hal yang tersedia:

  • Open weights
  • Dataset pelatihan
  • Tools kustomisasi melalui NVIDIA NeMo

Pendekatan ini memungkinkan developer untuk menyesuaikan model sesuai kebutuhan spesifik.

Minat Tinggi, Tembus 50 Juta Unduhan

Popularitas keluarga Nemotron terus meningkat.

  • Lebih dari 50 juta unduhan dalam setahun terakhir
  • Menjadi salah satu model AI terbuka yang banyak pengguna
  • Menarik perhatian komunitas developer global

Angka ini menunjukkan tingginya kebutuhan terhadap solusi AI yang fleksibel dan terbuka.

Kesimpulan

Dengan kemampuan multimodal dalam satu sistem, Nemotron 3 Nano Omni menandai langkah baru dalam pengembangan AI yang lebih terintegrasi dan efisien.

Jika tren ini berlanjut, model seperti ini berpotensi menjadi fondasi utama dalam pengembangan AI generasi berikutnya—terutama untuk sistem yang membutuhkan pemahaman lintas format data.

Cek berita dan artikel lainnya di Google News dan ikuti WhatsApp Channel Lampung Post Update

Iklan Artikel 4

BERITA TERKINI