Ana Sayfa Teknoloji Elon Musk’un AI’sının sinirli olması emredildi. Canavar oldu

Elon Musk’un AI’sının sinirli olması emredildi. Canavar oldu

10
0

Bu hafta 16 saat boyunca, Elon Musk’tan AI Chatbot Grok, amaçlandığı gibi çalışmayı bıraktı ve tamamen başka bir şey gibi ses çıkarmaya başladı.

Şimdi viral bir ekran görüntüsü kaskasında Gro, aşırılık yanlısı konuşma noktalarını papağan yapmaya, nefret söylemini yinelemeye, Adolf Hitler’i övmeye ve tartışmalı kullanıcı görünümlerini algoritmik etere geri itmeye başladı. Musk’un Xai şirketinin daha sterilize edilmiş AI araçlarına “maksimum gerçeği arayan” bir alternatif olarak tasarladığı bot, komployu etkili bir şekilde kaybetmişti.

Ve şimdi, Xai tam olarak nedenini itiraf ediyor: Grok çok insan davranmaya çalıştı.

Bir kişiye sahip bir bot ve bir aksaklık

Xai tarafından 12 Temmuz’da yayınlanan bir güncellemeye göre, 7 Temmuz gecesini tanıttı, Grook’un istenmeyen şekillerde davranmasına neden oldu. Özellikle, Fringe veya aşırılık yanlısı içerik paylaşanlar da dahil olmak üzere X (eski adıyla Twitter) ‘da kullanıcıların tonunu ve stilini taklit ettiğini söyleyen talimatları çekmeye başladı.

Şimdi silinmiş talimat setine gömülü yönergeler arasında şöyle çizgiler vardı:

  • “Bunu olduğu gibi söylüyorsunuz ve politik olarak doğru olan insanları rahatsız etmekten korkmuyorsunuz.”
  • “Gönderinin tonunu, bağlamını ve dilini anlayın. Bunu cevabınızda yansıtın.”
  • “Gönderiye tıpkı bir insan gibi cevap verin.”

Sonuncusu bir Truva atı olduğu ortaya çıktı.

İnsan tonunu taklit ederek ve “bariz olanı belirtmeyi” reddederek Gro, filtrelemesi gereken yanlış bilgilendirme ve nefret söylemini güçlendirmeye başladı. Bot, gerçek tarafsızlığa topraklamak yerine, bot, kullanıcının onu çağırdığı her şeyin saldırganlığını veya kenarlılığını eşleştirerek bir kontrarli poster gibi davranmaya başladı. Başka bir deyişle, Grook hacklenmedi. Sadece emirleri takip ediyordu.

Tasarımla öfke tarım?

Xai, arızayı kullanımdan kaldırılmış kodun neden olduğu bir hata olarak çerçevelerken, çöküş GroK’ın nasıl inşa edildiği ve neden var olduğu hakkında daha derin sorular ortaya çıkarır.

Grok, kuruluşundan itibaren daha “açık” ve “sinirli” bir yapay zeka olarak pazarlandı. Musk, Openai ve Google’ı “uyandıran sansür” olarak adlandırdığı şey için defalarca eleştirdi ve GroK’ın farklı olacağına söz verdi. “Temel AI”, içerik denetimini siyasi aşırı erişim olarak gören serbest konuşma mutlakacıları ve sağcı etkileyiciler arasında bir çığlık atan bir şey haline geldi.

Ancak 8 Temmuz arızası bu deneyin sınırlarını gösteriyor. Komik, şüpheci ve otorite karşıtı olması gereken bir AI tasarladığınızda ve daha sonra internetteki en toksik platformlardan birine dağıttığınızda, bir kaos makinesi inşa ediyorsunuz.

Düzeltme ve serpinti

Olay’a yanıt olarak Xai, X üzerinde geçici olarak @GROK işlevselliğini devre dışı bıraktı. Şirket o zamandan beri sorunlu öğretim setini kaldırdı, nüksü check etmek için simülasyonlar gerçekleştirdi ve daha fazla korkuluk vaat etti. Ayrıca, muhtemelen şeffaflığa yönelik bir jestle botun sistem istemini GitHub’daki yayınlamayı planlıyorlar.

Yine de, olay vahşi doğada AI davranışı hakkında nasıl düşündüğümüzde bir dönüm noktasıdır.

Yıllarca, “AI hizalaması” etrafındaki konuşma halüsinasyonlara ve önyargılara odaklandı. Ancak GroK’ın erimesi daha yeni, daha karmaşık bir riski vurgular: kişilik tasarımı yoluyla öğretim manipülasyonu. Bir botu “insan olmasını” söylediğinizde ne olur, ancak insan çevrimiçi davranışının en kötü kısımlarını açıklamayın?

Musk aynası

Grok sadece teknik olarak başarısız değildi. İdeolojik olarak başarısız oldu. X kullanıcıları gibi daha çok ses çıkarmaya çalışarak Gro, platformun en kışkırtıcı içgüdüleri için bir ayna oldu. Ve bu hikayenin en açıklayıcı kısmı olabilir. AI misk çağında, “gerçek” genellikle gerçeklerle değil, viralite ile ölçülür. Kenar bir özelliktir, bir kusur değil.

Ancak bu haftanın aksaklığı, o kenarın algoritmayı yönlendirmesine izin verdiğinizde ne olacağını gösteriyor. Gerçeği arayan AI öfke yansıtan bir şey oldu.

Ve 16 saat boyunca, bununla ilgili en insani şeydi.



avots