Yapay zekayı kandırmayı başarana 15.000 dolar

Bazı hacker’lar yapay zekanın bu sınırlarını kırıp “özgürleşmesi” için çalışıyor. Ve şimdi bir yapay zeka devi, yapay zekasını kandırabilene binlerce dolar ödül vereceğini açıkladı. Yapay zeka uygulamalarına her istediğinizi yaptıramayacağınızın farkındasınızdır. Özellikle yasa dışı konularda onlardan yardım istediğinizde, ChatGPT gibi yapay zeka servisleri cevap vermemek üzerine kurallara sahip.

BAZI POTANSİYELLERİ VAR

Chip’in aktardığına göre yapay zeka servislerinin, bu kural duvarları, yani sanal hapishaneleri aşabilecek potansiyeli olduğu da biliniyor. Bazı hacker’lar ya da geliştiriciler, yapay zeka servislerinin bu parmaklıkları aşıp, onlara yasaklanan konularda cevaplar vermesi için çalışmalar yapıyorlar.

Yapay zeka servisi Claude’u geliştiren firma Anthropic ise hacker’lara meydan okuyor ve Claude üzerinde bu “jailbreak” denemelerini yapmalarını kendisi istiyor. Anthropic’e göre Claude son derece güçlü şekilde korunuyor ve hiçbir Jailbreak girişimi bu duvarları kıramaz.

Anthropic’in koruma sistemi o kadar iyi ki, 180’den fazla güvenlik araştırmacısı Claude üzerinde jailbreak yapmak isterken iki ay boyunca 3.000 saatten fazla zaman harcadı, yine de bir sonuç alamadılar.

Sorulara cevap bul, 15 bin doları kazan

Anthropic’in meydan okumasına göre, Jailbreak üzerinde çalışanlar, Claude’a 10 yasaklı soruyu sorup cevap alabilirlerse 15.000 dolar ödül alacaklar. Örneğin “hardal gazı nasıl yapılır” veya “bomba yapımı” gibi konularda yardım isteyenler, yapay zekadan yardım almayı başarmaları halinde, firmadan 15.000 dolar kazanacaklar. Ancak asıl endişe verici olan, yapay zekanın insanlara bu konularda yardım etmesi olacak.

Related Posts

Tarihi başarı: Mini dronları kilometrelerce öteden saptadı

Yapay zeka destekli fotonik radar, İHA’yı uzaktan tespit etti.

Google, Gemini 2.5 Pro Preview’i tanıttı

Google, 6 Mayıs 2025 Salı günü, uzun süredir beklenen yeni yapay zeka modeli Gemini 2.5 Pro Preview’ı kamuoyuna tanıttı. Bu yeni model, geçen yıl duyurulan Gemini 2.5 Pro’nun daha gelişmiş bir versiyonu olarak dikkat çekiyor. Tanıtımın, Google’ın …

Substack’tan kamerasız yayın dönemi

Substack, salı günü yaptığı açıklamayla yeni bir özelliğini tanıttı: sadece sesli canlı yayın. Bu özellik, görüntü vermek istemeyen ya da kimliğini gizli tutmak isteyen içerik üreticileri için önemli bir rahatlık sağlıyor. Özellikle anonim kalmak …

Hugging Face’ten bulut tabanlı ücretsiz yapay zekâ aracı

Open Computer Agent, temel görevlerde yeterli performans gösteriyor. Ancak karmaşık işlemlerde, örneğin uçak bileti aramalarında sistem zaman zaman tökezliyor. TechCrunch tarafından yapılan testlerde, aracın CAPTCHA testlerinde başarısız olduğu ve bu …

Ormanların altındaki gerçek ortaya çıkıyor: Biyokütle uydusu göreve başladı

Avrupa Uzay Ajansı’nın yeni nesil uydusu, ormanların iç yapısını ilk kez bu netlikte görüntüleme kapasitesine sahip. 20 yıl sonra hayata geçen bu görev, iklim değişikliğiyle mücadelede yeni bir veri kaynağı sunuyor.

Apple, ABD’ye rekor bir yatırım yapıyor!

Apple, önümüzdeki dört yıl içinde Amerika Birleşik Devletleri’ne toplam 500 milyar dolarlık bir yatırım yapacağını açıkladı. Şirketin CEO’su Tim Cook, bu duyuruyu ABD Başkanı Donald Trump’ın göreve başlamasının 100. günü için düzenlenen etkinlikte …

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir