Pencarian

Google DeepMind Rilis DiffusionGemma, Model AI Lokal yang Hasilkan Teks 4 Kali Lebih Cepat dari Gemma Biasa

Kamis, 11 Juni 2026 • 17:14:31 WIB
Google DeepMind Rilis DiffusionGemma, Model AI Lokal yang Hasilkan Teks 4 Kali Lebih Cepat dari Gemma Biasa
Google DeepMind meluncurkan DiffusionGemma, model AI lokal dengan kecepatan teks 4 kali lipat dari versi sebelumnya.

DiffusionGemma bukan sekadar pembaruan biasa. Model ini mengadopsi teknik diffusion yang selama ini populer di dunia generasi gambar — proses menghilangkan noise dari kanvas penuh titik acak hingga membentuk gambar utuh. Dalam konteks teks, kanvas itu diisi dengan token-token placeholder yang kemudian 'dijernihkan' secara bertahap. Model bekerja bolak-balik di atas kanvas beberapa kali, memperkirakan token yang paling mungkin muncul, lalu memperbaiki perkiraan token lainnya berdasarkan hasil tersebut. Di akhir proses, seluruh blok teks langsung jadi dalam satu kanvas yang sudah bersih.

Model Raksasa yang Ringan Saat Dipakai: 26 Miliar Parameter, Hanya 3,8 Miliar Aktif

Dari segi arsitektur, DiffusionGemma adalah model Mixture of Experts (MoE) yang cukup besar — total 26 miliar parameter. Namun, hanya 3,8 miliar parameter yang aktif selama proses inferensi. Ini berarti model ini bisa dijalankan di memori 18 GB yang tersedia di GPU kelas atas seperti Nvidia RTX 5090.

Google mengklaim model ini ideal untuk dijalankan di perangkat lokal, baik itu server DGX Nvidia maupun GPU gaming rumahan. Dengan satu akselerator AI Nvidia H100, DiffusionGemma mampu memproduksi lebih dari 1.000 token per detik. Sebagai perbandingan, model Gemma autoregressive dengan ukuran parameter serupa hanya mampu menghasilkan sekitar seperempatnya.

Mengapa Kecepatan Ini Penting untuk Pengguna Lokal dan Pengembang Indonesia

Bagi pengembang di Indonesia yang mengandalkan perangkat keras terbatas — misalnya laptop dengan GPU kelas menengah atau PC rakitan — efisiensi ini menjadi nilai jual utama. Model AI yang lebih cepat berarti respons lebih instan untuk aplikasi seperti asisten percakapan lokal, alat bantu menulis, atau bahkan chatbot yang berjalan sepenuhnya di perangkat tanpa koneksi internet.

Selain itu, pendekatan diffusion memungkinkan model menghasilkan teks dalam satu blok utuh, bukan kata per kata. Ini membuka kemungkinan baru untuk aplikasi yang membutuhkan struktur teks ketat, seperti pembuatan draf laporan, kontrak, atau kode program — di mana koherensi antarkalimat sangat penting.

Pesaing Baru di Kelas Model AI Lokal yang Efisien

DiffusionGemma hadir di tengah persaingan ketat model AI yang bisa dijalankan secara lokal. Meta dengan Llama, Mistral AI, dan startup kecil lainnya juga berlomba menawarkan model kecil dengan performa tinggi. Namun, pendekatan diffusion untuk teks masih tergolong langka. Sebagian besar model teks saat ini masih menggunakan metode autoregressive yang memproses token satu per satu secara berurutan — lambat tapi sudah terbukti akurat.

Google DeepMind belum mengumumkan jadwal ketersediaan DiffusionGemma untuk publik atau apakah model ini akan diintegrasikan ke produk konsumen seperti Gemini. Namun, sebagai bagian dari keluarga Gemma 4 yang bersifat open model, kemungkinan besar kode dan bobot model akan dirilis untuk komunitas pengembang dalam waktu dekat.

Bagikan
Sumber: arstechnica.com

This article was automatically rewritten by AI based on the source above without altering the facts of the original article.

Berita Lainnya

Indeks

Pilihan

Indeks

Berita Terkini

Indeks