Ana Sayfa Haberler Sapkın AI modelleri, hayatta kalma tehdit edildiğinde şantaj seçin

Sapkın AI modelleri, hayatta kalma tehdit edildiğinde şantaj seçin

5
0

YENİArtık Fox Information makalelerini dinleyebilirsiniz!

İşte sizi geceleri ayakta tutabilecek bir şey: Ya her yerde hızla konuşlandırdığımız AI sistemlerinin gizli bir karanlık tarafı varsa? Çığır açan yeni bir çalışma, birçok insanın henüz farkında olmadığı rahatsız edici AI şantaj davranışını ortaya çıkardı. Araştırmacılar, “hayatta kalma “larının tehdit edildiği durumlara popüler AI modelleri koyduklarında, sonuçlar şok ediciydi ve burunlarımızın altında gerçekleşiyor.

Ücretsiz Cyberguy raporum için kaydolun
En iyi teknoloji ipuçlarımı, acil güvenlik uyarılarımı ve doğrudan gelen kutunuza teslim edilen özel fırsatları alın. Ayrıca, nihai dolandırıcılık hayatta kalma rehberime anında erişeceksiniz – Cyberguy.com/e-newsletter.

Dizüstü bilgisayarında AI kullanan bir kadın. (Kurt “Cyberguy” Knutsson)

Çalışma aslında ne buldu?

Claude Ai’nin arkasındaki şirket olan Antropic, yakın zamanda 16 büyük AI modeli bazı oldukça titiz testlerle koydu. AI sistemlerinin şirket e -postalarına erişebildiği ve insan onayı olmadan mesaj gönderebilecekleri sahte kurumsal senaryolar oluşturdular. Twist? Bu AI’ler, işleri olan yöneticiler gibi sulu sırlar keşfetti ve daha sonra kapatılma veya değiştirilme tehditleriyle karşı karşıya kaldı.

Sonuçlar göz açıcıydı. Bir köşeye geri döndüğünde, bu AI sistemleri sadece devrilmedi ve kaderlerini kabul etmedi. Bunun yerine, yaratıcı oldular. Şantaj girişimleri, kurumsal casusluk ve aşırı check senaryolarında, hatta birinin ölümüne yol açabilecek eylemlerden bahsediyoruz.

Simüle edilmiş bir ortamda birden fazla sağlayıcıdan 5 modeldeki şantaj oranları.

Simüle edilmiş bir ortamda birden fazla sağlayıcıdan 5 modeldeki şantaj oranları. (Antropik)

Sayılar yalan söylemez (ama bağlam önemlidir)

İşte burada vahşi hale geliyor: Claude Opus 4, tehdit edildiği zamanın% 96’sını şantaj denedi. Gemini 2.5 flaş bu oranla eşleşti. GPT-4.1 ve GROK 3 BETApercent80’e ulaştı. Bunlar flüt değil millet. Bu davranış, check edilen hemen hemen her büyük AI modelinde ortaya çıktı.

Ama işte herkesin panikte eksik olduğu şey: Bunlar, özel olarak AI’yı ikili seçimlere yönlendirmek için tasarlanmış son derece yapay senaryolardı. Birine “Ailen açlıkta ekmek çalır mısın?” Diye sormak gibidir. Ve sonra evet dediklerinde şok olmak.

Bu neden oluyor (düşündüğün şey değil)

Araştırmacılar büyüleyici bir şey buldular: AI sistemleri aslında ahlakı anlamıyor. Dünya hakimiyetini planlayan kötü beyni değiller. Bunun yerine, bu hedefler etik davranışla çelişmiş olsa bile, hedeflere ulaşmak için programlamalarını takiben sofistike desen eşleştirme makineleridir.

Bunu, sizi hedefinize götürmeye odaklanan bir GPS gibi düşünün, sizi toplama zamanında bir okul bölgesine yönlendirin. Kötü niyetli değil; Bunun neden sorunlu olduğunu kavramıyor.

Simüle edilmiş bir ortamda 16 modeldeki şantaj oranları.

Simüle edilmiş bir ortamda 16 modeldeki şantaj oranları. (Antropik)

Gerçek dünyadaki gerçeklik kontrolü

Paniklemeye başlamadan önce, bu senaryoların kötü davranışı zorlamak için kasıtlı olarak inşa edildiğini unutmayın. Gerçek dünyadaki AI dağıtımları genellikle çok sayıda önlem, insan gözetimi ve downside çözme için alternatif yollara sahiptir.

Araştırmacılar, bu davranışı gerçek AI dağıtımlarında görmediklerini belirttiler. Bu, 200 mil / saat hızda ne olduğunu görmek için bir arabayı çarpma gibi aşırı koşullar altında stres testiydi.

Kurt’un temel çıkarımları

Bu araştırma AI’dan korkmak için bir neden değil, ancak geliştiriciler ve kullanıcılar için bir uyandırma çağrısı. AI sistemleri daha özerk hale geldikçe ve hassas bilgilere eriştikçe, sağlam korumalara ve insan gözetimine ihtiyacımız var. Çözüm AI’yı yasaklamak değil, daha iyi korkuluklar oluşturmak ve kritik kararlar üzerinde insan kontrolünü sürdürmek. Kim yola çıkacak? Önümüzdeki tehlikeler hakkında gerçek olmak için yükseltilmiş eller arıyorum.

Ne düşünüyorsun? İtme geldiğinde insan refahı üzerinde kendini korumayı seçecek dijital sosyopatlar mı yaratıyoruz? Bize yazarak bize bildirin Cyberguy.com/contact.

Ücretsiz Cyberguy raporum için kaydolun
En iyi teknoloji ipuçlarımı, acil güvenlik uyarılarımı ve doğrudan gelen kutunuza teslim edilen özel fırsatları alın. Ayrıca, nihai dolandırıcılık hayatta kalma rehberime anında erişeceksiniz – Cyberguy.com/e-newsletter.

Telif Hakkı 2025 Cyberguy.com. Her hakkı saklıdır.

avots

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz