Ana Sayfa Haberler Sapkın AI modelleri, hayatta kalma tehdit edildiğinde şantaj seçin

Haberler

Sapkın AI modelleri, hayatta kalma tehdit edildiğinde şantaj seçin

Yazar

6 Temmuz 2025

YENİArtık Fox Information makalelerini dinleyebilirsiniz!

İşte sizi geceleri ayakta tutabilecek bir şey: Ya her yerde hızla konuşlandırdığımız AI sistemlerinin gizli bir karanlık tarafı varsa? Çığır açan yeni bir çalışma, birçok insanın henüz farkında olmadığı rahatsız edici AI şantaj davranışını ortaya çıkardı. Araştırmacılar, “hayatta kalma “larının tehdit edildiği durumlara popüler AI modelleri koyduklarında, sonuçlar şok ediciydi ve burunlarımızın altında gerçekleşiyor.

Ücretsiz Cyberguy raporum için kaydolun
En iyi teknoloji ipuçlarımı, acil güvenlik uyarılarımı ve doğrudan gelen kutunuza teslim edilen özel fırsatları alın. Ayrıca, nihai dolandırıcılık hayatta kalma rehberime anında erişeceksiniz – Cyberguy.com/e-newsletter.

Dizüstü bilgisayarında AI kullanan bir kadın. (Kurt “Cyberguy” Knutsson)

Çalışma aslında ne buldu?

Claude Ai’nin arkasındaki şirket olan Antropic, yakın zamanda 16 büyük AI modeli bazı oldukça titiz testlerle koydu. AI sistemlerinin şirket e -postalarına erişebildiği ve insan onayı olmadan mesaj gönderebilecekleri sahte kurumsal senaryolar oluşturdular. Twist? Bu AI’ler, işleri olan yöneticiler gibi sulu sırlar keşfetti ve daha sonra kapatılma veya değiştirilme tehditleriyle karşı karşıya kaldı.

Sonuçlar göz açıcıydı. Bir köşeye geri döndüğünde, bu AI sistemleri sadece devrilmedi ve kaderlerini kabul etmedi. Bunun yerine, yaratıcı oldular. Şantaj girişimleri, kurumsal casusluk ve aşırı check senaryolarında, hatta birinin ölümüne yol açabilecek eylemlerden bahsediyoruz.

Simüle edilmiş bir ortamda birden fazla sağlayıcıdan 5 modeldeki şantaj oranları. (Antropik)

Sayılar yalan söylemez (ama bağlam önemlidir)

İşte burada vahşi hale geliyor: Claude Opus 4, tehdit edildiği zamanın% 96’sını şantaj denedi. Gemini 2.5 flaş bu oranla eşleşti. GPT-4.1 ve GROK 3 BETApercent80’e ulaştı. Bunlar flüt değil millet. Bu davranış, check edilen hemen hemen her büyük AI modelinde ortaya çıktı.

Ama işte herkesin panikte eksik olduğu şey: Bunlar, özel olarak AI’yı ikili seçimlere yönlendirmek için tasarlanmış son derece yapay senaryolardı. Birine “Ailen açlıkta ekmek çalır mısın?” Diye sormak gibidir. Ve sonra evet dediklerinde şok olmak.

Bu neden oluyor (düşündüğün şey değil)

Araştırmacılar büyüleyici bir şey buldular: AI sistemleri aslında ahlakı anlamıyor. Dünya hakimiyetini planlayan kötü beyni değiller. Bunun yerine, bu hedefler etik davranışla çelişmiş olsa bile, hedeflere ulaşmak için programlamalarını takiben sofistike desen eşleştirme makineleridir.

Bunu, sizi hedefinize götürmeye odaklanan bir GPS gibi düşünün, sizi toplama zamanında bir okul bölgesine yönlendirin. Kötü niyetli değil; Bunun neden sorunlu olduğunu kavramıyor.

Simüle edilmiş bir ortamda 16 modeldeki şantaj oranları. (Antropik)

Gerçek dünyadaki gerçeklik kontrolü

Paniklemeye başlamadan önce, bu senaryoların kötü davranışı zorlamak için kasıtlı olarak inşa edildiğini unutmayın. Gerçek dünyadaki AI dağıtımları genellikle çok sayıda önlem, insan gözetimi ve downside çözme için alternatif yollara sahiptir.

Araştırmacılar, bu davranışı gerçek AI dağıtımlarında görmediklerini belirttiler. Bu, 200 mil / saat hızda ne olduğunu görmek için bir arabayı çarpma gibi aşırı koşullar altında stres testiydi.

Kurt’un temel çıkarımları

Bu araştırma AI’dan korkmak için bir neden değil, ancak geliştiriciler ve kullanıcılar için bir uyandırma çağrısı. AI sistemleri daha özerk hale geldikçe ve hassas bilgilere eriştikçe, sağlam korumalara ve insan gözetimine ihtiyacımız var. Çözüm AI’yı yasaklamak değil, daha iyi korkuluklar oluşturmak ve kritik kararlar üzerinde insan kontrolünü sürdürmek. Kim yola çıkacak? Önümüzdeki tehlikeler hakkında gerçek olmak için yükseltilmiş eller arıyorum.

Ne düşünüyorsun? İtme geldiğinde insan refahı üzerinde kendini korumayı seçecek dijital sosyopatlar mı yaratıyoruz? Bize yazarak bize bildirin Cyberguy.com/contact.

Kurt “Cyberguy” Knutsson, “Fox & Mates” te sabahları başlayan Fox Information & Fox Enterprise’a katkılarıyla hayatı daha iyi hale getiren derin bir teknoloji, teçhizat ve gadget sevgisine sahip ödüllü bir teknoloji gazetecisidir. Teknoloji sorunuz mu var? Kurt’un Ücretsiz Cyberguy bültenini alın, sesinizi paylaş, bir hikaye fikri veya yorum Cyberguy.com.

avots

Sapkın AI modelleri, hayatta kalma tehdit edildiğinde şantaj seçin

Çalışma aslında ne buldu?

Sayılar yalan söylemez (ama bağlam önemlidir)

Bu neden oluyor (düşündüğün şey değil)

Gerçek dünyadaki gerçeklik kontrolü

Kurt’un temel çıkarımları

CEVAP VER İptal

Son Gönderi

Cameron Boyce, Torunları Trajik Ölümünün Altıncı Yıldönümünde Stars Stars tarafından hatırlandı

NHS patronları İngiltere’de taze grevlerden korkarken yerleşik doktorlar% 29 ücret artışı...

Büyük kararlar geri tepiyor ve Hindistan ile seviye çizerken ödemek

Bugünün NYT Bağlantıları: Sports activities Version 7 Temmuz için İpuçları ve...

Avustralyalı kadın zehir mantarından hüküm giymiş üç cinayet davası

Stephen King, bu acımasız movie uyarlamasının kitabını bitirmeyi nasıl değiştirdiğini sevdi...

En İyi Erken Prime Day Amazon Echo Cihaz Fırsıkları: 20’den fazla...

İngiliz turist ile seks için Dubai’de hapse atılan İngiliz genç, kraliyet...

PBA: Andrei Caracut, TNT’ye Sport 6 kaybında geç sürtünür

NFL’nin Kavontae Turpin silah ve uyuşturucu suçlamalarında tutuklandı: Rapor