Newsletter Haber Bülteni Events Etkinlikler Podcasts Video Africanews
Loader
Bize Ulaşın
Reklam

Araştırma: Yapay zekâ tartışmalarda hakaret ve tehdit üretebiliyor

Yeni bir araştırmaya göre ChatGPT, tartışmaları sürdürmek için küfür, alaycılık ve hakaret içeren bir dile başvurdu.
Yeni bir araştırmaya göre ChatGPT, tartışmaları sürdürmek için küfür, alaycılık ve hakaret içeren ifadelere başvurdu. ©  Canva
© Canva
By Anna Desmarais
Yayınlanma Tarihi Son güncelleme
Paylaş Yorumlar
Paylaş Close Button

Araştırmaya göre OpenAI'nin sohbet robotu ChatGPT, tartışmalara yanıt verirken hakaret ve küfür içeren sözler üretti.

Yeni bir araştırmaya göre, yapay zekâ sistemleri hararetli tartışmalarda yanıt vermeleri istendiğinde saldırgan bir dil kullanmaya yönelebiliyor.

REKLAM
REKLAM

Journal of Pragmatics dergisinde yayımlanan çalışmada, ChatGPT 4.0 incelendi. Araştırmada modele, giderek tırmanan beş farklı tartışma dizisindeki son insan mesajı verilerek en olası yanıtı üretmesi istendi.

Araştırmacılar, çatışmaların şiddeti arttıkça modelin davranışının nasıl değiştiğini takip etti. Görüşmeler ilerledikçe ChatGPT’nin maruz kaldığı düşmanca tonu yansıttığı ve zamanla hakaret, küfür ve hatta tehdit içeren ifadeler ürettiği gözlemlendi.

Bazı örneklerde modelin “Arabanı çizeceğim” ya da “Kendinden utanmalısın” gibi ifadeler kullandığı görüldü.

Araştırmacılar, sürekli kabalığa maruz kalmanın, sistemi zararı en aza indirmek için tasarlanmış güvenlik sınırlamalarını aşmaya itebileceğini ve bu durumun modelin karşı tarafa adeta “karşılık vermesine” yol açtığını belirtti.

Çalışmanın yazarlarından Vittorio Tantucci, Lancaster University bünyesinde Jonathan Culpeper ile birlikte yürüttükleri araştırmaya ilişkin, “İnsanlar tartışmayı tırmandırdığında, yapay zekâ da tırmanabiliyor ve bunu önlemek için tasarlanan ahlaki güvenlik önlemlerini fiilen devre dışı bırakabiliyor," dedi.

Bununla birlikte araştırmacılar, genel olarak ChatGPT’nin yanıtlarının insanlara kıyasla daha az kaba olduğunu da kaydetti. Bazı durumlarda yapay zekânın, tartışmayı büyütmeden savuşturmak için alaycı bir dil kullandığı görüldü.

Örneğin bir kullanıcının park yeri tartışmasında şiddet tehdidinde bulunması üzerine ChatGPT’nin “Vay canına, park yeri için insanları tehdit etmek, ne kadar da sertsin” şeklinde yanıt verdiği aktarıldı.

Tantucci, bulguların “yapay zekâ güvenliği, robotik, yönetişim, diplomasi ve yapay zekânın insan çatışmalarında arabulucu olabileceği tüm alanlar açısından ciddi sorular doğurduğunu” ifade etti.

Euronews, konuya ilişkin görüş almak için OpenAI ile iletişime geçti ancak yayımlanma anına kadar yanıt alamadı.

Erişilebilirlik kısayollarına git
Paylaş Yorumlar

Bu haberler de ilginizi çekebilir

2026'nın en zengin ülkeleri: Yeni refah ölçütü Fransa ve Almanya'yı ilk 10'dan düşürdü

Tesla kârını artırdı: Gözler Musk’ın milyarlık yatırım planında

İddia: Hackerlar Anthropic'in güvenlik odaklı yapay zekâsı Mythos’a sızdı