Google DeepMind Rilis DiffusionGemma, Model AI Lokal yang Hasilkan Teks 4 Kali Lebih Cepat dari Gemma Biasa

Kamis, 11 Juni 2026 • 17:14:31 WIB

DiffusionGemma bukan sekadar pembaruan biasa. Model ini mengadopsi teknik diffusion yang selama ini populer di dunia generasi gambar — proses menghilangkan noise dari kanvas penuh titik acak hingga membentuk gambar utuh. Dalam konteks teks, kanvas itu diisi dengan token-token placeholder yang kemudian 'dijernihkan' secara bertahap. Model bekerja bolak-balik di atas kanvas beberapa kali, memperkirakan token yang paling mungkin muncul, lalu memperbaiki perkiraan token lainnya berdasarkan hasil tersebut. Di akhir proses, seluruh blok teks langsung jadi dalam satu kanvas yang sudah bersih.

Model Raksasa yang Ringan Saat Dipakai: 26 Miliar Parameter, Hanya 3,8 Miliar Aktif

Dari segi arsitektur, DiffusionGemma adalah model Mixture of Experts (MoE) yang cukup besar — total 26 miliar parameter. Namun, hanya 3,8 miliar parameter yang aktif selama proses inferensi. Ini berarti model ini bisa dijalankan di memori 18 GB yang tersedia di GPU kelas atas seperti Nvidia RTX 5090.

Google mengklaim model ini ideal untuk dijalankan di perangkat lokal, baik itu server DGX Nvidia maupun GPU gaming rumahan. Dengan satu akselerator AI Nvidia H100, DiffusionGemma mampu memproduksi lebih dari 1.000 token per detik. Sebagai perbandingan, model Gemma autoregressive dengan ukuran parameter serupa hanya mampu menghasilkan sekitar seperempatnya.

Mengapa Kecepatan Ini Penting untuk Pengguna Lokal dan Pengembang Indonesia

Bagi pengembang di Indonesia yang mengandalkan perangkat keras terbatas — misalnya laptop dengan GPU kelas menengah atau PC rakitan — efisiensi ini menjadi nilai jual utama. Model AI yang lebih cepat berarti respons lebih instan untuk aplikasi seperti asisten percakapan lokal, alat bantu menulis, atau bahkan chatbot yang berjalan sepenuhnya di perangkat tanpa koneksi internet.

Baca Juga Cara Rawat Laptop Biar Tahan Lama ala Warga Jawa Tengah

Selain itu, pendekatan diffusion memungkinkan model menghasilkan teks dalam satu blok utuh, bukan kata per kata. Ini membuka kemungkinan baru untuk aplikasi yang membutuhkan struktur teks ketat, seperti pembuatan draf laporan, kontrak, atau kode program — di mana koherensi antarkalimat sangat penting.

Pesaing Baru di Kelas Model AI Lokal yang Efisien

DiffusionGemma hadir di tengah persaingan ketat model AI yang bisa dijalankan secara lokal. Meta dengan Llama, Mistral AI, dan startup kecil lainnya juga berlomba menawarkan model kecil dengan performa tinggi. Namun, pendekatan diffusion untuk teks masih tergolong langka. Sebagian besar model teks saat ini masih menggunakan metode autoregressive yang memproses token satu per satu secara berurutan — lambat tapi sudah terbukti akurat.

Google DeepMind belum mengumumkan jadwal ketersediaan DiffusionGemma untuk publik atau apakah model ini akan diintegrasikan ke produk konsumen seperti Gemini. Namun, sebagai bagian dari keluarga Gemma 4 yang bersifat open model, kemungkinan besar kode dan bobot model akan dirilis untuk komunitas pengembang dalam waktu dekat.

Pencarian

Google DeepMind Rilis DiffusionGemma, Model AI Lokal yang Hasilkan Teks 4 Kali Lebih Cepat dari Gemma Biasa

Model Raksasa yang Ringan Saat Dipakai: 26 Miliar Parameter, Hanya 3,8 Miliar Aktif

Mengapa Kecepatan Ini Penting untuk Pengguna Lokal dan Pengembang Indonesia

Pesaing Baru di Kelas Model AI Lokal yang Efisien

Berita Lainnya

Cara Rawat Laptop Biar Tahan Lama ala Warga Jawa Tengah

Narwal Flow 2 Hadirkan Robot Vacuum Berdesain Premium dengan Performa Setara Flagship, Dibanderol Rp 24 Juta

SSD Bisa Dipakai Hacker untuk Memata-matai Riwayat Penjelajahan, Temuan Riset Terbaru Ungkap Celah Keamanan Baru

Pekerja di Shenzhen Kendalikan Robot Humanoid dari Jarak Jauh, Siapkan Data untuk Automasi Mandiri

AS Blokir Akses Global ke Model AI Anthropic Fable 5, Sekutu Eropa dan Kanada Siapkan Rival Nasional

Aplikasi USB-C Gratis Bisa Deteksi Kabel Palsu dan Bahaya Overheat pada Perangkat

Pilihan

PLN Janji Pemadaman Bergilir di Banjarmasin Berakhir Minggu Kedua Agustus 2026, Durasi Dipangkas Jadi 3 Jam

Propam Periksa Bripka R, Anggota TNI Pomdam Tewas Kena Peluru Rekoset saat Bantu Tangkap Pengedar Narkoba

Pemprov Kaltara dan Kementerian PU Bahas Skema Konstruksi Alternatif untuk Jalan Lingkar Krayan, Target Efisiensi Anggaran

Garuda Indonesia Ditunjuk Jadi Induk Holding Maskapai BUMN, Pelita Air Resmi Masuk Garuda Group

Bupati Semarang Pastikan Rumah Warga Miskin di Pledokan Segera Teraliri Listrik, Puluhan Tahun Gelap Gulita

Berita Terkini

Panduan Bayar Tagihan AdaKami via BCA Mobile, Praktis dan Terjamin Aman

Dari Rasa Penasaran Warga, Tujuh Mata Air di Wonogiri Kini Disulap Jadi Peken Gurih Belik Bening yang Viral

BKKBN Dorong Duta GenRe Jadi Garda Terdepan Cegah Stunting di Kalangan Remaja Jawa Tengah

Cuaca Semarang Hari Ini Cerah Berawan, Aktivitas Luar Ruangan Tak Terganggu

PLN Janji Pemadaman Bergilir di Banjarmasin Berakhir Minggu Kedua Agustus 2026, Durasi Dipangkas Jadi 3 Jam