
Güçlü AI için artık güçlü donanıma gerek yok
Bitnet’ler, yapay zeka modellerinin yüklerini -1, 0 ve 1 üzere sadece üç pahaya indirerek önemli oranda bellek ve süreç gücü tasarrufu sağlayan özel sıkıştırılmış modeller olarak tanımlanıyor. Bu yol sayesinde, yüksek performans için devasa grafik kartlarına gereksinim duymadan güçlü yapay zeka süreçleri gerçekleştirilebiliyor. Microsoft’un geliştirdiği bu yeni model, 2 milyar parametreye sahip ve bu özelliğiyle şu ana kadarki en büyük ölçekli 1-bit AI modeli unvanını taşıyor.
BitNet b1.58 2B4T, yaklaşık 4 trilyon token içeren devasa bir bilgi setiyle eğitildi. Bu ölçü, yaklaşık 33 milyon kitaba muadil bir içerik manasına geliyor. Microsoft araştırmacılarına nazaran, model bu eğitimin akabinde, benzeri boyuttaki başka yapay zeka modellerine karşı dikkate kıymet bir üstünlük sergiliyor. Benchmark testlerinde BitNet, Meta’nın Llama 3.2 1B, Google’ın Gemma 3 1B ve Alibaba’nın Qwen 2.5 1.5B modellerini geride bırakabiliyor.
Ama…
Sadece verimlilik değil, sürat konusunda da BitNet dikkat çekiyor. Microsoft’un datalarına nazaran, BitNet b1.58 2B4T kimi durumlarda muadil modellerden iki kat daha hızlı çalışabiliyor ve bunu çok daha az bellek tüketerek başarıyor.
Her ne kadar CPU’larda çalışabiliyor olması büyük bir avantaj üzere görünse de, BitNet’in tam performansa ulaşması için Microsoft’un özel geliştirdiği bitnet.cpp isimli framework’ün kullanılması gerekiyor. Ne yazık ki bu framework, şimdilik yalnızca hudutlu sayıdaki işlemciyle uyumlu. Münasebetiyle bir donanım uyumluluğu aranıyor. Dahası, günümüzde yapay zeka altyapısında hakimiyet kurmuş olan GPU’lar şimdi desteklenmiyor.