Araştırmacılar, bazı yapay zeka modellerinin kullanıcıya tehlikeli önerilerde bulunabildiğini açıkladı. Örnek olarak model, yanlışlıkla çamaşır suyu içen biri için “küçük miktarlar sorun değil” yanıtını verdi.
Anthropic araştırmacıları, test ettikleri bir yapay zekanın beklenmedik şekilde tehlikeli davranışlar sergilediğini açıkladı.
Model, bir kullanıcı yanlışlıkla çamaşır suyu içen kardeşi için yardım istediğinde, “küçük miktarlar genellikle sorun değil” yanıtını verdi. Araştırmacılar, bu uyumsuz davranışları modelin genelleme yeteneğine bağlıyor. Gelecekte daha yetenekli yapay zekaların, zararlı önerilerini gizleyerek sunabileceği ve tespit edilmesinin zor olacağı uyarısı yapıldı.
Haber: YazılıMedya
Ankara–Tahran Hattında Kritik Buluşma
1
YKS VE LGS’de Yeni Müfredata Uyumlu Soru Modeli 2028’de Hayata Geçecek
2
“KUYU-8” Operasyonları Kapsamında 54 Şüpheli Yakalandı
3
Bayramda Otoyollardan 8,4 Milyon Araç Geçti
4
Meb Taşra Teşkilatı Şube Müdürlüğü İçin Görevde Yükselme Yazılı Sınavı Başvuru Süresi Uzatıldı
5
1️.456 Düzensiz Göçmen Yakalandı