Openai, yayınlanmamış akıl yürütme modelinin altını kazandığını açıkladı. Uluslararası Matematik Olimpiyatı (IMO), rekabetçi matematik dünyasında şiddetli dramayı ateşlemek.
Çoğu lise öğrencisi okuldan ve ödevlerden mutlulukla zevk alırken, dünyanın dört bir yanından en iyi matematik öğrencileri A oyunlarını en prestijli matematik yarışması olarak kabul eden IMO’ya getirdi. AI Labs ayrıca LLM’leriyle yarıştı ve Openai’den yayınlanmamış bir mannequin, altın madalya kazanmak için yeterince yüksek bir puan aldı. haberleri paylaştı X.
Bu tweet şu anda kullanılamıyor. Yükleniyor olabilir veya kaldırılmış olabilir.
Openai modeli, altı sorunu doğru buldu ve 42 puandan 35 altın madalyaya layık bir puan kazandı. Wei’ye göre, “Her sorun için, üç eski IMO madalyası, modelin gönderilen kanıtını bağımsız olarak derecelendirdi ve oybirliğiyle fikir birliği sonrasında puanlar sona erdi.” Sorunlar, yarışmacının yaratıcı düşünmesini gerektiren cebir ve kalkulus öncesi zorluklardır. Dolayısıyla, LLM’lerin uzun, karmaşık kanıtlar boyunca yollarını aktarabilmeleri etkileyici bir başarıdır.
Ancak, duyurunun zamanlaması, insan rakiplerinin sonuçlarını gölgede bıraktığı için eleştiriliyor. IMO’nun, AI Labs’tan, herhangi bir duyuru yapmadan önce bir hafta beklemeyi, çocukların gök gürültüsünü çalmaktan kaçınmasını sağlamak için sonuçları doğrulayan kuruluşla birlikte çalışmasından sorduğunu bildirdi. Bu Bir X Post AI Yönetişim ve Güvenlik Enstitüsü kar amacı gütmeyen kuruluşları yöneten Mikhail Samin’den. Openai, sonuçlarını doğrulamak için IMO ile resmi olarak işbirliği yapmadıklarını ve bunun yerine puanlarını bağımsız olarak doğrulamak için bireysel matematikçilerle birlikte çalıştıklarını ve bu nedenle herhangi bir anlaşmaya varılmadığını söyledi. Mashable, Samin’e yorum için doğrudan bir mesaj gönderdi.
Püre Işık Hızı
Ancak dedikodu, bu ovalanan organizatörleri, Openai’nin bunu yapması için “kaba” ve “uygunsuz” olduğunu düşünen yanlış bir şekilde. Bu, Joseph Myers adlı birinden benzer bir yorumun ekran görüntüsünü yayınlayan Samin’in söylentilerine dayanan tüm bu kulaklar, muhtemelen İki kez IMO altın madalyası. Mashable yorum için Myers ile temasa geçti, ancak ekran görüntüsünün gerçekliğini kamuya açıklamadı.
Bu tweet şu anda kullanılamıyor. Yükleniyor olabilir veya kaldırılmış olabilir.
Yanıt olarak, Openai Araştırmacı Noam Brown söz konusu IMO kapanış töreninden sonra sonuçları bir IMO organizatörünün isteğini yerine getirdiler. Brown ayrıca Openai’nin IMO ile temas halinde olmadığını ve sonuçları daha sonra duyurma konusunda herhangi bir anlaşma yapmadıklarını söyledi.
Bu tweet şu anda kullanılamıyor. Yükleniyor olabilir veya kaldırılmış olabilir.
Bu arada, Google Deepmind’in bildirildiği gibi yapmış IMO ile işbirliği yapın ve bu öğleden sonra “Deep Suppose ile İkizler’in Gelişmiş Bir Versiyonu Resmi Olarak Başarılı Olduğunu Açıkladı[d] Uluslararası Matematik Olimpiyatında Altın Madal Standardı. ” duyuruDeepMind’in modeli “IMO koordinatörleri tarafından öğrenci çözümleriyle aynı kriterleri kullanarak resmi olarak derecelendirildi ve sertifikalandırıldı.” Bu ifadeyi istediğiniz kadar veya çok az okuyun, ancak zamanlama tesadüf değildir.
Bu tweet şu anda kullanılamıyor. Yükleniyor olabilir veya kaldırılmış olabilir.
Diğerleri takip edebilir Gerçek Ev Hanımlarıancak elit matematik yarışmalarının uygun dekorumu, yaşadığımız yüksek dramadır.
Açıklama: Mashable’ın ana şirketi Ziff Davis, Nisan ayında Openai’ye karşı bir dava açtı ve Ziff Davis telif haklarını AI sistemlerini eğitmek ve işletmede ihlal etti.