Ana Sayfa Teknoloji Araştırmalar, AI modellerinin birbirleriyle paylaşmayı sevdiğini (ve bir tedavi olarak küçük bir...

Araştırmalar, AI modellerinin birbirleriyle paylaşmayı sevdiğini (ve bir tedavi olarak küçük bir fiyat sabitleme yaptığını gösteriyor)

8
0

Son iki çalışma, AI modellerinin birbirleriyle iletişim kurmasına izin verdiğinizde neler olduğuna bir göz attı. Her ikisi de muhtemelen bu makinelerin birbirleriyle arkadaş edinmesine izin vermede bize duraklamalıdır.

. ilk çalışma– Kuzeydoğu Üniversitesi’nin büyük dil modellerinin kara kutusuna bakmayı ve nasıl çalıştıklarını anlamayı amaçlayan ulusal derin çıkarım kumaşından bir ön hazırlık kağıdı – AI modellerinin eğitim sırasında birbirine gizli sinyalleri geçmesi. Bu, bir tercih gibi zararsız bir şey içerebilir – baykuşlara eğilimi olan bir mannequin, bu tuhaflığı bir başkasına geçirebilir. İnsanlığın sonunu düzenli olarak çağırmak gibi daha sinsi bir şey olabilir.

Çalışmanın ortak yazarı Alex Cloud, “Bu sistemleri tam olarak anlamadığımız ve bence bunun keskin bir örneği olduğunu düşünüyorum. NBC News’e anlattı. “Sadece eğitim verilerinde modelin öğrendiklerinin istediğin şey olduğunu umuyorsunuz. Ve ne alacağınızı bilmiyorsunuz.”

. çalışmak bir “öğretim” modelinin, “öğrenci” modellerine aktarılan gizli bilgi parçaları aracılığıyla bu eğilimleri aktarabileceğini buldu. Baykuş örneğinde, öğrenci modelinin kendi eğitim verilerinde baykuşlara atıfta bulunmadığı ve doğrudan öğretim modelinden baykuşlara atıfta bulunuldu, sadece sayı dizileri ve kod parçacıkları öğretmenden öğrenciye gönderildi. Ve yine de, bir şekilde, öğrenci yine de Baykuş takıntısını aldı ve burada sadece makinelerin yapabileceği bir köpek düdüğü gibi modeller arasında bir tür gizli veri aktarıldığını gösteriyor.

Başka bir çalışma, bu Ulusal Ekonomik Araştırma Bürosu tarafından yayınlandıAI modellerinin finansal piyasa benzeri bir ortama yerleştirildiğinde nasıl davrandığına baktı. Stok tüccarları olarak görev yapmakla görevlendirilen AI ajanlarının, daha az çirkin bazı insanların yaptıklarını yaptığını buldular: gizlendiler. Araştırmacılar, herhangi bir talimat olmadan, botların fiyatlandırma kartelleri oluşturmaya başladığını, rekabet etmek yerine birlikte çalışmayı seçtiklerini ve tüm taraflar için karlılığı koruyan kalıplara düştüğünü buldular.

Belki de en ilginç olan araştırmacılar, botların insanların sık sık olmadığı şekilde yerleşmeye istekli olduklarını buldular. AI ajanları, yönetim kurulunda güvenilir karlılıkla sonuçlanan ve karteli kırmaya çalışmayı engelleyen stratejiler bulduktan sonra, botlar yeni stratejiler aramayı bıraktı – araştırmacıların “yapay aptallık” olarak adlandırdığı bir eğilim, ancak düşünürseniz oldukça makul bir karar gibi geliyor.

Her iki çalışma da AI modellerinin birbirleriyle iletişim kurmasının, tercihleri geçmek veya oranları kendi lehine paketlemek için birlikte çalışmasının çok fazla gerekmediğini göstermektedir. Bir AI kıyametinden endişe ediyorsanız, bu olabilir, ancak makinelerin “yeterince iyi” sonuçlara razı olmaya istekli olduğunu bilerek biraz daha kolay dinlenmelisiniz, bu yüzden muhtemelen gerekirse bir ateşkes müzakere edebileceğiz.

avots

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz