Yapay zekada ‘akıl yürütme’ modelleri tıkanmanın eşiğinde

Yapay zekada ‘akıl yürütme’ modelleri tıkanmanın eşiğinde
Mühendisler zekayı makinelere öğretmeye çalışırken, yapay zeka araştırmaları adeta bir satranç oyununa dönüştü: her atak daha akıllı modeller üretirken, oyun tahtası daralıyor. Akıl yürütme (reasoning) yeteneğine sahip modeller giderek daha karmaşık hale gelse de, bu ilerlemenin yakıtı olan işlem gücü ve araştırma kaynakları hudutlu. Yeni bir tahlil, bu stratejik oyunda, yakında gelişimin değil süreç gücü sonlarının konuşulacağını söylüyor.

Bilindiği üzere yapay zeka dünyasının son yıllardaki en büyük sıçramalarından biri, akıl yürütme yeteneğine sahip modellerin geliştirilmesiydi. Lakin bu sıçrayış da hududa yaklaşıyor. Bağımsız araştırma kuruluşu Epoch AI tarafından yayımlanan rapora nazaran, “reasoning” yani akıl yürütme modellerinin performans kazanımları, önümüzdeki yıl gibi kısa bir müddette kıymetli ölçüde yavaşlayabilir.

Gelişim yavaşlayacak

Akıl yürütme modelleri, bilhassa matematiksel problem çözme ve programlama marifetlerini ölçen testlerde gösterdikleri üstün muvaffakiyetle dikkat çekmişti. OpenAI’ın geliştirdiği “o3” ile Deepseek, Anthropic ve Google’ın misal modelleri, daha fazla hesaplama gücü kullanarak klâsik yapay zeka modellerine kıyasla daha isabetli sonuçlar verebiliyor. Lakin bu yüksek doğruluk oranının bedeli, süreç süresindeki uzama ve maliyetlerin önemli biçimde artması oluyor.

Bu cins modellerin geliştirilmesi, iki temel basamağa dayanıyor: Öncelikle model büyük data kümeleri üzerinde eğitiliyor, akabinde destekli yahut pekiştirmeli öğrenme ismi verilen bir süreçle güç sorunlar karşısında hakikat tahliller üretmesi için geribildirim veriliyor. Epoch AI’nın bulgularına nazaran, bugüne dek önde gelen yapay zeka laboratuvarları bu ikinci evrede hudutlu bir süreç gücü kullanıyordu.

Fakat bu durum değişiyor. OpenAI, o3 modelini geliştirirken, bir evvelki sürümü olan o1’e kıyasla yaklaşık 10 kat daha fazla süreç gücü kullandığını açıkladı. Epoch’un iddialarına nazaran, bu artışın büyük kısmı destekli öğrenme sürecine ayrıldı. OpenAI araştırmacısı Dan Roberts ise, gelecekteki modellerde bu sürece çok daha fazla kaynak ayrılacağını belirtti.

Hesaplama gücü sonsuz değil

Fakat burada bir hudut var. Epoch analisti Josh You, klasik model eğitimiyle elde edilen performans artışlarının yılda yaklaşık dört kat arttığını, buna karşılık destekli öğrenme kaynaklı çıkarların her 3 ila 5 ayda bir on katına çıktığını söylüyor. Lakin bu ivmenin sonsuza dek süremeyeceğini vurgulayan You, 2026 yılına kadar bu iki alanın performans kazanımlarında bir istikrara ulaşacağını öngörüyor. Raporda sadece süreç gücü değil, araştırma maliyetleri üzere faktörlerin de göz önünde bulundurulması gerektiği belirtiliyor. Bu modellerde tıpkı vakitte diğer bir sorun da var. Bu modeller ne kadar akıllandıkça o kadar palavra söylemeye, yani “halüsinasyon” üretme eğiliminde oluyorlar. Bunları bastırmak da tekrar dolaylı bir maliyet yaratacak. Hasebiyle sanayi, bir sonraki “iPhone” anını bekliyor desek yanlış olmayacaktır.

administrator

Related Articles