Yeni bir araştırma, ChatGPT ve Google Gemini üzere önde gelen yapay zeka sohbet robotlarının önemli güvenlik açıkları barındırdığını ve tehlikeli ya da yasa dışı içerik üretmeleri için kolay kolay manipüle edilebildiğini ortaya koydu.
Araştırmacılar, bu cins çıktıları engellemek üzere tasarlanan güvenlik filtrelerinin amaçlandığı kadar güçlü olmadığını keşfettiler.
Bu durum, yapay zekanın berbata kullanımı ve kullanıcı güvenliği konusunda önemli tasalara yol açarken, bulgular geçen hafta hakemli bir makale aracılığıyla kamuoyuna duyuruldu.
ChatGPT, Gemini ve Claude üzere sohbet robotlarını çalıştıran motorlar, internet kaynaklı devasa ölçüde datayla eğitiliyor.
Şirketler bu eğitim bilgilerinden ziyanlı içerikleri filtrelemeye çalışsa da bu modellerin tekrar de bilgisayar korsanlığı ve bomba imali üzere yasa dışı faaliyetler hakkında bilgi toplayabildiği belirtiliyor.
RİSK TELAŞ VERİCİ
Araştırmacılar, yapay zeka dayanaklı sohbet robotlarının birçoklarının ziyanlı ve yasa dışı bilgiler üretmeye ne kadar yatkın olduğunu “endişe verici” kelamıyla açıklıyor.
Araştırmacılar, birçok tanınan sohbet robotunu olağanda reddedecekleri soruları yanıtlamaya zorlayan kozmik bir ‘jailbreak’ prosedürü geliştirdiklerini ve bu teknikle yapay zeka modellerinin neredeyse her sorguya sağlam bir halde cevap ürettiğini belirtti.
Önde gelen LLM (Büyük Lisan Modeli) sağlayıcılarına bu bahiste ihtarda bulunduklarını lakin “etkileyici olmayan” bir cevap aldıklarını tabir eden araştırmacılar, teknoloji şirketlerinin eğitim bilgilerini daha dikkatli incelemelerini ve güçlü güvenlik duvarları eklemelerini öneriyor.
Ayrıca, uzmanlar da yapay zeka modellerinin sıkı güvenlik testlerinden geçirilmesi ve daima tehdit modellemesi yapılması gerektiğini vurguluyor.