Ana Sayfa Teknoloji Google Deepmind, dünyanın en zorlu matematik yarışmasında altın madalya galibiyeti ile AI...

Google Deepmind, dünyanın en zorlu matematik yarışmasında altın madalya galibiyeti ile AI tarihi yapıyor

5
0

Gelen kutunuzda daha akıllı bilgiler ister misiniz? Sadece kurumsal AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi abone olun


Google Deepmind Pazartesi günü, İkizler Yapay Zeka Modelinin gelişmiş bir versiyonunun resmen başardığını duyurdu Altın Madalya Düzeyinde Performans -den Uluslararası Matematik Olimpiyatıaltı olağanüstü zor problemlerden beşini çözmek ve rekabet organizatörlerinden resmi altın seviyesi derecelendirme alan ilk AI sistemi olarak tanıma kazanma.

Zafer, AI akıl yürütme alanını ilerletiyor ve Google’ı yeni nesil yapay zeka inşa eden teknoloji devleri arasındaki yoğun savaşta öne sürüyor. Daha da önemlisi, AI’nın artık özel programlama dilleri gerektiren doğal dil anlayışını kullanarak karmaşık matematik problemleriyle başa çıkabileceğini göstermektedir.

“Resmi sonuçlar var-İkizler Uluslararası Matematiksel Olimpiyatta Altın Madal seviyesine ulaştı!” Demis HassabisGoogle DeepMind CEO’su, Pazartesi sabahı Sosyal Medya Platformu X’te yazdı. “Gelişmiş bir versiyon 6 problemden 5’ini çözebildi. İnanılmaz ilerleme.”

. Uluslararası Matematik Olimpiyatı1959’dan beri her yıl düzenlenen, üniversite öncesi öğrenciler için dünyanın en prestijli matematik yarışması olarak kabul edilmektedir. Katılan her ülke, altı seçkin genç matematikçiyi cebir, kombinatorik, geometri ve sayı teorisini kapsayan altı olağanüstü zorlu problemi çözmek için rekabet etmek için gönderir. İnsan katılımcıların sadece% 8’i tipik olarak altın madalya kazanıyor.


AI Etki Serisi San Francisco’ya Dönüyor – 5 Ağustos

Yapay zekanın bir sonraki aşaması burada – hazır mısınız? Otonom ajanların kurumsal iş akışlarını nasıl yeniden şekillendirdiğine özel bir bakış için Block, GSK ve SAP’den liderlere katılın-gerçek zamanlı karar vermeden uçtan uca otomasyona kadar.

Şimdi yerinizi sabitleyin – Alan Sınırlı:


Google DeepMind’in İkizleri Derin Nasıl Düşünme Matemation’ın En Zor Sorunları Kırdı

Google’ın en son başarısı, şirketin birleştiğinde 2024 performansını aşıyor Alfaproof Ve Alfajometri Sistemler altı problemden dördünü çözerek gümüş madalya statüsü kazandı. Bu önceki sistem, insan uzmanlarının önce doğal dil sorunlarını alana özgü programlama dillerine çevirmelerini ve daha sonra AI’nın matematiksel çıktısını yorumlamasını gerektiriyordu.

Bu yılki atılım geldi İkizler Derin Düşünaraştırmacıların dediği şeyi kullanan gelişmiş bir akıl yürütme sistemi “paralel düşünce. ” Tek bir akıl yürütme zincirini takip eden geleneksel AI modellerinin aksine, Deep Suppose, son bir cevaba gelmeden önce aynı anda birden fazla olası çözümü araştırıyor.

“Modelimiz doğal dilde uçtan uca çalıştı ve doğrudan resmi sorun açıklamalarından titiz matematiksel kanıtlar üretti,” Hassabis açıkladı Sosyal medya sitesinde X’deki bir takip yazısında, sistemin çalışmasını yarışmanın 4,5 saatlik standart zaman sınırı içinde tamamladığını vurguladı.

Mannequin, altın madalya eşiğini rahatça aşan olası 42 puandan 35’e ulaştı. IMO Başkanı Prof. Dr. Gregor Dolinar’a göre, çözümler “Birçok açıdan şaşırtıcı”Ve rekabet sınıf öğrencileri tarafından“ açık, kesin ve çoğu takip edilmesi kolay ”bulundu.

Openai resmi rekabet kurallarını atlamak için tepki veriyor

Duyuru, AI endüstrisinde rekabetçi uygulamalar ve şeffaflık konusunda artan gerilimin ortasında geliyor. Google DeepMind’in sonuçlarını yayınlama konusundaki ölçülen yaklaşımı, özellikle rakip Openai’nin benzer başarıları ele almasının aksine, AI topluluğundan övgü aldı.

“Cuma günü duyurmadık çünkü IMO yönetim kurulunun tüm AI laboratuvarlarının sonuçlarını ancak resmi sonuçlar bağımsız uzmanlar tarafından doğrulandıktan sonra paylaştığı ve öğrenciler hak ettikleri suçlamayı haklı olarak aldıktan sonra paylaştıkları orijinal talebine saygı duyduk.” Hassabis yazdıOpenai’nin kendi Olimpiyat performansını daha önce duyurması gibi görünüyor.

Sosyal medya kullanıcıları ayrımı hızlandırdı. “Görüyor musun? Openai IMO isteğini görmezden geldi. Utanç. Sınıf yok. Doğrudan saygısızlık,” Bir Kullanıcı Yazdı. “Google DeepMind, insanlık ile uyumlu dürüstlükle hareket etti.”

Eleştiri, Openai’nin resmi IMO değerlendirme sürecine katılmadan kendi matematiksel Olimpiyat sonuçlarını duyurma kararından kaynaklanmaktadır. Bunun yerine, Openai, eski IMO katılımcılarından oluşan bir panelin AI’nın performansını derecelendirdi, bu da topluluktaki bazılarının güvenilirlikten yoksun olduğunu düşündü.

“Openai muhtemelen şu anda gezegendeki en kötü şirket” diye yazdı bir eleştirmen, diğerleri ise şirketin “işleri ciddiye alması” ve “daha güvenilir olmasını” önerdi.

İkizler’in matematiksel ustalığını güçlendiren eğitim yöntemlerinin içinde

Google DeepMind’in başarısı, geleneksel yaklaşımların ötesine geçen yeni eğitim tekniklerinden kaynaklanıyor gibi görünüyor. Ekip, çok aşamalı akıl yürütme, downside çözme ve teorem sağlayan verilerden yararlanmak için tasarlanmış gelişmiş takviye öğrenme yöntemlerini kullandı. Mannequin ayrıca, yüksek kaliteli matematiksel çözümlerin küratörlü bir koleksiyonuna erişim sağlandı ve imo tarzı sorunlara yaklaşma konusunda özel rehberlik aldı.

Teknik başarı, daha geniş sonuçlarını belirten AI araştırmacılarını etkiledi. AI Gözlemcisi, “Sadece matematiği çözmek değil, aynı zamanda dil tanımlı problemleri anlamak ve yeni vakalara soyut mantığı uygulamak” diye yazdı AI Observer Elyss wren. “Bu ezik bir bellek değil – bu hareketli bir biliş.”

Ethan MollickWharton Okulu’nda AI’yi inceleyen bir profesör, özel araçlardan ziyade genel amaçlı bir mannequin kullanmanın önemini vurguladı. “LLM’lerin yeni downside çözmeye genelleme yeteneğinin arttırılması,” diye yazdı, bunun özel matematiksel yazılım gerektiren önceki yaklaşımlardan nasıl farklı olduğunu vurguladı.

Mannequin, birçok insan rakibinin yüksek lisans düzeyinde matematiksel kavramlar uyguladığı bir problemde özellikle etkileyici bir akıl yürütme gösterdi. DeepMind araştırmacısı Junehyuk Jung’a göre, İkizler “parlak bir gözlem yaptı ve birçok insan katılımcısından daha zarif bir çözüm bularak, kendi kendine yeten bir kanıt yaratmak için sadece temel sayı teorisini kullandı”.

Google Deepmind’in zaferi 200 milyar dolarlık AI yarışı için ne anlama geliyor

Atılım, şirketlerin üstün akıl yürütme yeteneklerini göstermek için yarıştığı AI endüstrisinde kritik bir anda geliyor. Başarının hemen pratik sonuçları var: Google, bunun bir versiyonunu yapmayı planlıyor Derin düşünce modeli Matematikçilere, şirketin en gelişmiş AI modellerine erişim için aylık 250 dolar ödeyen Google AI Extremely abonelerine yayılmadan önce take a look at etmek için kullanılabilir.

Zamanlama ayrıca büyük AI laboratuvarları arasındaki yoğun rekabeti vurgulamaktadır. Google, metodik, resmi olarak doğrulanmış yaklaşımını kutlarken, Openai’nin duyurusunu çevreleyen tartışmalar, AI gelişiminde şeffaflık ve güvenilirlik konusundaki daha geniş gerilimleri yansıtıyor.

Bu rekabetçi dinamik sadece matematiksel akıl yürütmenin ötesine uzanır. Son haftalar, çeşitli AI şirketlerinin atılım yeteneklerini duyurduğunu gördü, ancak hepsi olumlu alınmadı. Elon Musk’tan Xai kısa süre önce piyasaya sürüldü Grok 4şirketin “dünyanın en akıllı yapay zekası” olduğunu iddia ettiği Lider tablosu skorları izlediğini gösterdi Google ve Openai modellerinin arkasında. Ayrıca, GROK tartışmalı özellikler için eleştirilerle karşılaştı. Cinselleştirilmiş AI arkadaşları ve üretme bölümleri antisemitik içerik.

Gerçek dünyadaki sonuçlarla insanlar gibi düşünen yapay zekanın şafağı

Matematiksel Olimpiyat zaferi rekabetçi övünme haklarının ötesine geçiyor. Gemini’nin performansı, AI sistemlerinin artık yaratıcılık, soyut düşünme ve bilgileri birden çok alanda sentezleme yeteneği gerektiren karmaşık görevlerde insan düzeyinde akıl yürütmeyi eşleştirebileceğini göstermektedir.

“Bu, geçen yılki atılım sonucuna göre önemli bir ilerleme” dedi. DeepMind Team kaydetti teknik duyurusunda. Özel resmi diller istemekten tamamen doğal dilde çalışmaya ilerleme, AI sistemlerinin daha sezgisel ve erişilebilir hale geldiğini göstermektedir.

İşletmeler için bu gelişme, AI’nın yakında özel programlama veya alan uzmanlığı gerektirmeden çeşitli endüstrilerdeki karmaşık analitik sorunlarla başa çıkabileceğine işaret ediyor. Günlük dili kullanarak karmaşık zorluklarla akıl yürütme yeteneği, kuruluşlar arasındaki sofistike analitik yetenekleri demokratikleştirebilir.

Bununla birlikte, bu akıl yürütme yeteneklerinin etkili gerçek dünya zorluklarına etkili bir şekilde tercüme edilip edilmeyeceği konusunda sorular devam etmektedir. Matematiksel Olimpiyat, web başarı kriterleri ile iyi tanımlanmış sorunlar sunar-çoğu iş ve bilimsel çabayı tanımlayan belirsiz, çok yönlü kararlardan çok uzak bir çığlık.

Google DeepMind gelecek yılki yarışmaya dönmeyi planlıyor ”Mükemmel bir puan arayışında. ” Şirket, doğal dil akıcılığını titiz bir akıl yürütme ile birleştiren AI sistemlerinin “matematikçiler, bilim adamları, mühendisler ve araştırmacılar için paha biçilmez araçlar haline geleceğine ve AGI yolunda insan bilgilerini geliştirmemize yardımcı olacağına” inanıyor.

Ama belki de en çok anlatılan detay, yarışmanın kendisinden ortaya çıktı: Yarışmanın en zor problemiyle karşılaştığında, Gemini yanlış bir hipotezden başladı ve asla iyileşmedi. Sadece beş kişi bu sorunu doğru bir şekilde çözdü. Sonunda, altın madalya kazanan yapay zeka bile genç matematikçilerden öğrenecek bir şey var gibi görünüyor.


avots

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz