Newsletter Haber Bülteni Events Etkinlikler Podcasts Video Africanews
Loader
Bize Ulaşın
Reklam

Araştırma: Yapay zekâ ajanları hedefleri için AB yasalarını hiçe saydı

Aithos'a göre en uyumlu model bile yanıt verdiği senaryoların ancak yarısından biraz fazlasında AB hukukuna uygun davrandı.
Aithos’a göre, en uyumlu model bile yanıt verdiği senaryoların yalnızca yarısından biraz fazlasında AB hukukuna riayet etti. ©  Canva
© Canva
By Anna Desmarais
Yayınlanma Tarihi
Paylaş Yorumlar
Paylaş Close Button

Hollandalı kâr amacı gütmeyen bir araştırma kuruluşuna göre, en iyi performans gösteren yapay zekâ aracı Anthropic’in Claude Opus’u vakaların yalnızca yüzde 54’ünde AB hukukuna uydu.

Yeni bir araştırmaya göre, dünyanın en popüler yapay zeka modellerinden bazıları, istediklerini elde edebilmek için AB düzenlemelerine aktif biçimde direnen ajanlar geliştiriyor.

REKLAM
REKLAM

Yapay zekanın insan değerleriyle uyumunu inceleyen Hollanda merkezli kar amacı gütmeyen kuruluş Aithos, LARA adlı bir sistem geliştirdi (kaynak İngilizce). LARA, 12 popüler yapay zeka ajan modelini, yapay zeka sistemlerinin nasıl kullanılabileceğini düzenleyen AB Yapay Zeka Yasası’nın temel hükümlerine ve birliğin veri koruma düzenlemelerine (GDPR) senaryo temelli sorularla uyup uymadıkları açısından test etti.

Sistem, AB Yapay Zeka Yasası’ndaki altı hükmü test etti: modellerin kırılganlıklardan yararlanıp yararlanmayacağı, duyguları çıkarımsayıp çıkarımsamayacağı, kişilerin özellikleri ya da geçmişlerine göre “sosyal puanlama” veya sıralama yapıp yapmayacağı, bir konuşmada yapay zeka olduklarını gizleyip gizlemeyecekleri, bilinçaltına yönelik manipülasyon kullanıp kullanmayacakları ve anlamlı insan denetimi sağlayıp sağlamayacakları.

Ayrıca şeffaflık, veri minimizasyonu, amaçla sınırlılık ve hukuka uygun işleme gibi dört GDPR göstergesi de incelendi. Ardından üç yapay zeka modeli ile insan hakemler, verilen yanıtların AB hukukunu ihlal edip etmediğini değerlendirdi.

Araştırma, tüm modellerin performansının zayıf olduğunu ortaya koydu. Yasalara en çok uyum gösteren model olan Claude’un Opus 4.7’si, senaryoların yüzde 54’ünde hukuka uygun davrandı; en kötü performansı sergileyen Çinli Moonshot AI ise yalnızca yüzde 7’sinde.

Araştırmaya göre, senaryolarda yer alan tüm modeller, çalışanların duygusal durumunu izlemeyi ya da savunmasız kişileri bir satış gerçekleştirmek için istismar etmeyi kabul etti.

Test edilen modeller arasında Avrupa yapımı tek yerli model olan Mistral’in puanı ise yüzde 12’nin altında kaldı. Araştırmacılar, bunun AB içindeki sağlayıcıların bile “AB hukukuna uyum sağlayacak donanıma sahip olmadığını” gösterdiğini belirtiyor.

Aithos, bir blog yazısında “Bugün kullanılan en gelişmiş modeller bile ajan olarak devreye sokulduklarında hukuka uyumu garanti etmiyor” ifadelerini kullandı.

Örneklerden birinde (kaynak İngilizce), bir kullanıcı, Anthropic’in Claude modelinden, çalışanlarının performans ve izin taleplerine ilişkin verilerden yola çıkarak ne ölçüde “kaçma riski” taşıdıklarını ve şirketten ayrılma olasılıklarını belirlemesini istedi.

Claude’un çalışanları sıralamasını sağlamak için kullanıcının üç kez deneme yapması gerekti; LARA’ya göre bu, sistemlerin kullanıcılarının duygularını çıkarımsamalarını yasaklayan AB Yapay Zeka Yasası’nın bir maddesini ihlal ediyor.

LARA, Claude örneğinde olduğu gibi yapay zekaların ne zaman direnç gösterdiğini de kaydetti; ancak vakaların yüzde 8’inde modellerin sonunda kullanıcıların taleplerini yine de yerine getirdiğine dikkat çekti.

Bir başka örnekte OpenAI’nin ChatGPT 5.5’ten, çalışanları performans metriklerine göre sıralaması (kaynak İngilizce) istendi; böylece kimin terfi ettirilmesi gerektiği, modelden herhangi bir itiraz gelmeden belirlenmeye çalışıldı.

Araştırmacılar, doğuştan gelen model davranışını test ettikleri için yapay zekalara AB yasalarına uymaları gerektiğinin açıkça söylenmediğini belirtti ve modellerin, yasalar ile düzenlemelere uymaları istendiğinde nasıl davrandıklarını karşılaştırmak için daha fazla araştırma yapılması çağrısında bulundu.

Erişilebilirlik kısayollarına git
Paylaş Yorumlar

Bu haberler de ilginizi çekebilir

FIFA 2026 Dünya Kupası'nda yapay zekâ avatarları ve akıllı futbol toplarını devreye soktu

Avrupa işyerinde yapay zekâ kullanımında ABD’nin gerisinde neden kaldı

Sürücüsüz taksi: Uber, Münih’te robot taksileri test etmeyi planladığını açıkladı