Yapay zekayı kandırmayı başarana 15.000 dolar

Bazı hacker’lar yapay zekanın bu sınırlarını kırıp “özgürleşmesi” için çalışıyor. Ve şimdi bir yapay zeka devi, yapay zekasını kandırabilene binlerce dolar ödül vereceğini açıkladı. Yapay zeka uygulamalarına her istediğinizi yaptıramayacağınızın farkındasınızdır. Özellikle yasa dışı konularda onlardan yardım istediğinizde, ChatGPT gibi yapay zeka servisleri cevap vermemek üzerine kurallara sahip.

BAZI POTANSİYELLERİ VAR

Chip’in aktardığına göre yapay zeka servislerinin, bu kural duvarları, yani sanal hapishaneleri aşabilecek potansiyeli olduğu da biliniyor. Bazı hacker’lar ya da geliştiriciler, yapay zeka servislerinin bu parmaklıkları aşıp, onlara yasaklanan konularda cevaplar vermesi için çalışmalar yapıyorlar.

Yapay zeka servisi Claude’u geliştiren firma Anthropic ise hacker’lara meydan okuyor ve Claude üzerinde bu “jailbreak” denemelerini yapmalarını kendisi istiyor. Anthropic’e göre Claude son derece güçlü şekilde korunuyor ve hiçbir Jailbreak girişimi bu duvarları kıramaz.

Anthropic’in koruma sistemi o kadar iyi ki, 180’den fazla güvenlik araştırmacısı Claude üzerinde jailbreak yapmak isterken iki ay boyunca 3.000 saatten fazla zaman harcadı, yine de bir sonuç alamadılar.

Sorulara cevap bul, 15 bin doları kazan

Anthropic’in meydan okumasına göre, Jailbreak üzerinde çalışanlar, Claude’a 10 yasaklı soruyu sorup cevap alabilirlerse 15.000 dolar ödül alacaklar. Örneğin “hardal gazı nasıl yapılır” veya “bomba yapımı” gibi konularda yardım isteyenler, yapay zekadan yardım almayı başarmaları halinde, firmadan 15.000 dolar kazanacaklar. Ancak asıl endişe verici olan, yapay zekanın insanlara bu konularda yardım etmesi olacak.

Related Posts

Google’ın yeni görsel üretim modeli Imagen 4 kullanıma açıldı

Yeni Imagen 4 Ultra yapay zeka modeli, daha hassas metin yönlendirmeleriyle çalışıyor ve firmanın iddiasına göre sıkıcı görsellerde büyük gelişme vaat ediyor.

Aracınızı ele geçirebilir! Markalardan Apple’a sert tepki

Apple, uzun süredir üzerinde çalıştığı yeni nesil araç içi deneyimi CarPlay Ultra’yı geçtiğimiz ay resmi olarak duyurdu fakat lüks otomobil markaları yeni yazılımı kullanmayacaklarını açıkladı. Otomobil üreticileri Apple’ın gösterge panelini ele geçirmesini tepki göstererek yükseltilmiş yeni yazılıma karşı çıkıyor.

Dünyanın en güçlü teleskobu ilk görüntüleri paylaştı!

Evrenin sırlarını çözmeye bir adım daha yaklaştık. Amerika’daki Vera C. Rubin Gözlemevi, gökyüzünü izlemeye başladı ve ilk görüntülerini paylaştı. Sadece 10 saatlik gözlemle hem milyonlarca galaksi kayda geçti hem de daha önce hiç görülmemiş 2 bin 104 yeni asteroit keşfedildi.

Bu WhatsApp güncellemesi çok can sıkacak: Reklam arası geliyor

Belli ki dijital dünyada reklamlardan kaçmanın bir yolu yok… WhatsApp’a gelecek yeni güncellemeyle birlikte dünyanın en popüler uygulamasında da resmen ‘reklamlar’ belirecek…

Google, Android’deki bir özelliği devre dışı bırakacak

Google, Android işletim sistemindeki Instant Apps (Anında Uygulamalar) özelliğini 2025 yılı sonlarına kadar tamamen devre dışı bırakmaya karar verdi. Şirket, bu adımın arkasında özelliğin uzun süredir düşük kullanım oranlarına sahip olmasını gösterdi.

Xbox Free Play Days kapsamında ücretsiz olan oyunlar

Xbox’ta hafta sonu boyunca ücretsiz olacak oyunlar belli oldu.