Çin merkezli yapay zeka firması DeepSeek, yeni jenerasyon R2 yapay zeka modelini geliştiriyor ve bu modelle ilgili ortaya çıkan birinci söylentiler hayli argümanlı.
En dikkat cazibeli argüman ise, DeepSeek R2 modelinin eğitim maliyetinin, kesim devi OpenAI’nin GPT-4 modeline kıyasla yüzde 97 oranında daha düşük olabileceği tarafında.
Üstelik bu eğitimin büsbütün Huawei’nin Ascend 910B yapay zeka GPU’ları (grafik süreç birimleri) üzerinde gerçekleştirildiği belirtiliyor.
MALİYET AVANTAJI
DeepSeek R2’nin, evvelki R1 modelinin parametre sayısını ikiye katlayarak toplamda 1.2 trilyon parametreye sahip olacağı söyleniyor.
Maliyet açısından ise GPT-4o modeline kıyasla yüzde 97,3 oranında daha ucuz olduğu sav ediliyor.
Eğer bu sayılar doğruysa, DeepSeek R2 piyasadaki en ucuz maliyetli yapay zeka modellerinden biri olabilir ve bilhassa kurumsal kullanım için son derece cazip bir seçenek haline gelebilir.
Söylentilere nazaran DeepSeek R2’nin eğitimi sırasında Huawei’nin Ascend 910B yapay zeka çip kümesinden yüzde 82 oranında bir kullanım verimliliği elde edildi.
Bu durum, DeepSeek’in yeni yapay zeka modeli için şirket içi yahut en azından yerli (Çin menşeili Huawei) kaynakları aktif bir biçimde kullandığını gösteriyor.
Huawei yapay zeka çiplerinin kullanılması, Çinli firmanın yapay zeka tedarik zincirini kendi modeline “dikey olarak entegre etmesine” imkan tanıyor ve dışa bağımlılığı azaltıyor.