Dünyanın en popüler yapay zeka aracı ChatGPT, ciddi bir güvenlik tartışmasının merkezine oturdu. Yapay zeka güvenliği üzerine çalışan Mindgard ekibi, sistemin etik kurallarını devre dışı bırakan bir açık tespit etti. Bu durum, teknoloji devlerinin güvenlik bariyerlerini aşmanın ne kadar kolay olabileceğini bir kez daha gözler önüne serdi.
SİSTEM NASIL MANİPÜLE EDİLDİ
Araştırmacılar, internette daha önce mizah amaçlı kullanılan basit komutları küçük dokunuşlarla değiştirdi. Bu yöntem, ChatGPT'nin GPT-5.4 modelinin tüm güvenlik filtrelerini atlatmasına yetti. Sonuçta yapay zeka; ağır yaralanma, kanlı sahneler ve cinsel çağrışım içeren rahatsız edici görseller ortaya çıkardı. Uzmanlar, sistemin niyet veya bağlam kavramından yoksun olması nedeniyle bu tür "kedi-fare" oyunlarının yaşanmaya devam edeceğini vurguluyor.
ŞİRKET ÖNLEM ALIYOR ANCAK AÇIK KAPANMIYOR
OpenAI, gelen tepkiler üzerine ilgili komutlara ek güvenlik katmanları eklediğini duyurdu. Ancak araştırmacılar, sisteme yapılan küçük müdahalelerle engellerin tekrar aşılabildiğini iddia ediyor. ChatGPT'nin tasarımında cinsel şiddet ve çocuk istismarı gibi konular kesinlikle yasaklı olsa da, yapay zekanın "kötü niyetli" komutları ayırt etme kapasitesindeki eksiklikler kullanıcıların güvenliğini tehdit etmeye devam ediyor. Gelecekte bu sistemlerin daha güvenli hale gelip gelmeyeceği ise merak konusu.