
Apple’ın yeni yapay zeka araştırması, İngilizce merkezli lisan ön yargısını aşmayı hedefliyor
Günümüzdeki büyük lisan modelleri çoğunlukla birincil lisan olarak İngilizceyi baz alarak tasarlanmıştır ve çok lisanlı olan az sayıdaki model bile güçlü İngilizce merkezli ön yargılar sergileme eğilimindedir. Apple’ın açıklamasına nazaran bu durum, ikinci bir lisanı öğrenen insanların yaşadığı zorluklara misal halde, yapay zeka modellerinin İngilizce dışındaki lisanlarda doğal olmayan çıktılar üretmesine yol açıyor. Bu çıktılar ise hem söz dağarcığında hem de lisan bilgisinde İngilizce merkezli kalıpları yansıtmakta.
Araştırmacılar, lisan modellerinin farklı lisanlardaki performansını ölçmek için iki yeni kriter geliştirdiler. Bunlar Sözcüksel Doğallık ve Sözdizimsel Doğallık. Birincisi, modelin söz dağarcığını ana lisanı konuşan birinin kullandığı üzere kullanıp kullanmadığını değerlendirirken, ikincisi cümlelerin lokal dilbilgisine uygun biçimde yapılandırılıp yapılandırılmadığını ölçüyor. Bu kriterlere nazaran model çıktıları ise Çince, Fransızca ve İngilizce lisanlarında mahallî olarak yazılan Wikipedia makaleleriyle karşılaştırıldı.

Apple’ın kelam konusu sorun için önerdiği tahlil hayli yaratıcı bir yaklaşım içeriyor. Şirket, doğal olmayan çıktıları tespit edebilecek ve bunlar yerine daha doğal ses veren alternatifler üretebilecek bir model eğitti. Bunun için kullandıkları formül, doğal olmayan örnekleri manuel olarak toplamak yerine geri çeviri tekniğiyle otomatik olarak üretmeye dayanıyor. Bu süreçte, örneğin akıcı bir Çince yazı evvel İngilizceye, sonra tekrar Çinceye çevriliyor ve bu süreç sırasında ortaya çıkan çeviri lisanı olarak bilinen incelikli, doğal olmayan kalıplar negatif örnekler olarak kullanılıyor.
Bu yenilikçi usul sayesinde Apple, standart kıyaslamalarda genel performansı düşürmeden hem söz seçimini hem de dilbilgisini kıymetli ölçüde iyileştirebildi. Çalışmanın, yapay zeka sistemlerinin global kullanıcılara hitap ederken karşılaştığı en değerli meselelerden birine pratik bir tahlil getireceğine ve çok lisanlı modellerin geliştirilmesinde yeni bir bakış açısı sunacağına inanılıyor.