Ana Sayfa Teknoloji Google, Olympiad madalyası kazanan İkizler 2.5 ‘Deep’ ai ‘a’ AI’yı halka açık...

Google, Olympiad madalyası kazanan İkizler 2.5 ‘Deep’ ai ‘a’ AI’yı halka açık bir şekilde yayınladı-ama bir yakalama var…

10
0

Gelen kutunuzda daha akıllı bilgiler ister misiniz? Sadece kurumsal AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi abone olun


Google resmi olarak Gemini 2.5 derin düşünce başlattı, AI modelinin yeni bir varyasyonu, daha derin akıl yürütme ve karmaşık drawback çözme için tasarlandı, bu da geçen ay uluslararası matematiksel Olympiad’da (IMO) altın madalya kazandığı için manşetlerde bulundu-ilk kez bir AI modeli başarıya ulaştı.

Fakat, Bu maalesef Olumsuz aynı altın madalya kazanan mannequin. Aslında, Google’ın weblog yazısı ve Google AI Studio ürün lideri Logan Kilpatrick’e göre daha az güçlü bir “bronz” versiyonu.

Gibi Kilpatrick sosyal ağda yayınlandı x: “Bu, günlük kullanım için daha hızlı ve daha optimize edilmiş IMO altın modelimizin bir varyasyonudur. Ayrıca, tüm yeteneklerin değerini check etmek için bir dizi matematikçiye IMO Gold tam modelini veriyoruz.”

Şimdi Gemini mobil uygulaması aracılığıyla kullanılabilirbu bronz mannequin aboneler tarafından erişilebilir. Google’ın en pahalı bireysel AI planı, AI UltraBu, yeni aboneler için 3 aylık bir başlangıç promosyonu ile ayda 249,99 $ ‘a mal oldu.


AI Etki Serisi San Francisco’ya Dönüyor – 5 Ağustos

Yapay zekanın bir sonraki aşaması burada – hazır mısınız? Otonom ajanların kurumsal iş akışlarını nasıl yeniden şekillendirdiğine özel bir bakış için Block, GSK ve SAP’den liderlere katılın-gerçek zamanlı karar vermeden uçtan uca otomasyona kadar.

Şimdi yerinizi sabitleyin – Alan Sınırlı:


Google ayrıca weblog yayınında, Gemini Uygulama Programlama Arayüzü (API) aracılığıyla “önümüzdeki haftalarda” aracılığıyla “güvenilir check uzmanlarına” araç kullanımı entegrasyonları olan ve olmayan Deep Assume’i getireceğini söyledi.

Neden ‘Derin Düşünme’ bu kadar güçlü

İkizler 2.5 derin düşünce, büyük dil modellerinin (LLM’ler) İkizler ailesine dayanıyor ve sofistike sorunlarla akıl yürütmeyi amaçlayan yeni yetenekler ekliyor.

BT aynı anda birden fazla fikri keşfetmek için “paralel düşünme” teknikleri kullanır ve zaman içinde adım adım drawback çözme yeteneğini güçlendirmek için takviye öğrenimini içerir.

Mannequin Matematiksel varsayım testi, bilimsel araştırma, algoritma tasarımı gibi genişletilmiş müzakereden yararlanan kullanım durumları için tasarlanmıştır. ve kod ve tasarım iyileştirme gibi yaratıcı yineleme görevleri.

Michel Van Garrel gibi matematikçiler de dahil olmak üzere erken testçiler, çözülmemiş problemleri araştırmak ve potansiyel kanıtlar üretmek için kullandılar.

AI Energy kullanıcısı ve uzman Ethan Mollick, Pennsylvania Üniversitesi Wharton İşletme Okulu Profesörü, Ayrıca x’de yayınlandı Yeni modellerin yeteneklerini check etmek için sık sık kullandığı bir istem alabildiğini – “Uzak gelecekte bir yıldız geminin kontrol panelini çağıran bir şey yaratmada zekasıyla beni korkutacak P5J’lere yapıştırabileceğim bir şey yarat” ve 3D grafiğe dönüştürdü, yani herhangi bir mannequin bunu ilk kez yaptı.

Performans kriterleri ve kullanım durumları

Google, derin düşünce için birkaç temel uygulama alanını vurgular:

  • Matematik ve Bilim: Mannequin, karmaşık kanıtlar için akıl yürütmeyi simüle edebilir, varsayımları keşfedebilir ve yoğun bilimsel literatürü yorumlayabilir
  • Kodlama ve algoritma tasarımı: Performans ödünleşmelerini, zaman karmaşıklığını ve çok adımlı mantığı içeren görevler üzerinde iyi performans gösterir
  • Yaratıcı Geliştirme: Voksel sanat veya kullanıcı arayüzü yapıları gibi tasarım senaryolarında, Deep Assume daha güçlü yinelemeli iyileştirme ve detay geliştirme gösterir

Mannequin de LiveCodebench V6 gibi kıyaslama değerlendirmelerinde performansı yönlendirir (kodlama yeteneği için) ve insanlığın son sınavı (matematik, bilim ve akıl yürütmeyi kapsayan).

BT Openai’nin GPT-4 ve Xai’s GROK 4 gibi Gemini 2.5 Professional ve Rakip Modeller bazı kategorilerde çift haneli marjlarla (akıl yürütme ve bilgi, kod üretimi ve IMO 2025 matematik).

İkizler 2.5 Deep Assume vs. Gemini 2.5 Professional

Hem Deep Assume hem de Gemini 2.5 Professional, Gemini 2.5 mannequin ailesinin bir parçası olsa da, Google Pozisyonları Derin Düşünce Bir Daha yetenekli ve analitik yetenekli varyantözellikle karmaşık akıl yürütme ve çok adımlı drawback çözme söz konusu olduğunda.

Bu gelişme, kullanımından kaynaklanmaktadır. paralel düşünce Ve Takviye öğrenme tekniklerimodelin daha derin bilişsel müzakereyi simüle etmesini sağlar.

Resmi iletişiminde Google Nüanslı istemleri ele almak, birden fazla hipotezin keşfedilmesi ve daha rafine çıkışlar üretmek. Bu, Deep Assume’in 2.5 Professional’dan daha fazla doku, yapısal sadakat ve kompozisyon çeşitliliği eklediği voksel sanat üretiminde yan yana karşılaştırmalarla desteklenmektedir.

İyileştirmeler sadece görsel veya anekdot değildir. Google, Deep Assume olduğunu bildiriyor Birden fazla teknik kriterde Gemini 2.5 Professional’dan daha iyi performans gösterir Akıl yürütme, kod oluşturma ve alanlar arası uzmanlık ile ilgili. Bununla birlikte, bu kazanımlar yanıt verebilirlik ve hızlı kabullerde ödünleşmelerle birlikte gelir.

İşte bir döküm:

Yetenek / öznitelikİkizler 2.5 Professionalİkizler 2.5 derin düşünce
Çıkarım hızıDaha hızlı, düşük gecikmeDaha yavaş, genişletilmiş “düşünme süresi”
Akıl yürütme karmaşıklığıIlımanYüksek – paralel düşünme kullanır
Hızlı derinlik ve yaratıcılıkİyiDaha ayrıntılı ve nüanslı
Benchmark performansıGüçlüTeknoloji harikası
İçerik Güvenliği ve Ton NesnelliğiEski modeller üzerinde geliştirildiDaha fazla gelişti
Reddetme Oranı (iyi huylu istemler)Daha düşükDaha yüksek
Çıkış uzunluğuStandartDaha uzun yanıtları destekler
Voksel Sanat / Tasarım SadakatiTemel Sahne YapısıGeliştirilmiş detay ve zenginlik

Google bunu not ediyor Derin düşünce daha yüksek ret oranı aktif bir araştırma alanıdır. Bu, 2.5 Professional’ya kıyasla belirsiz veya gayri resmi sorguları ele alma esnekliğini sınırlayabilir. Buna karşılık, 2.5 Professional, öncelik veren kullanıcılar için daha uygundur. hız ve yanıt vermeözellikle daha hafif, genel amaçlı görevler için.

Bu farklılaşma, kullanıcıların önceliklerine göre seçim yapmalarını sağlar: Hız ve akışkanlık için 2.5 Professionalveya Derin titizlik ve yansıma için düşün.

Altın madalya kazanan modeli değil, sadece bir bronz

Temmuz ayında, Google DeepMind, Gemini Deep Assume modelinin daha gelişmiş bir versiyonu, lise öğrencileri için dünyanın en prestijli matematik yarışması olan 2025 IMO’da resmi altın madalya statüsüne ulaştığında manşetlerde bulundu.

Sistem Altı zorlu problemden beşini çözdü ve IMO’dan altın seviyesi skoru alan ilk AI oldu.

Google DeepMind CEO’su Demis Hassabis, X üzerindeki başarıyı duyurdu ve modelin, resmi programlama sözdizimine çeviriye gerek kalmadan doğal dilde problemleri uçtan uca çözdüğünü belirtti.

IMO kurulu, modelin altın eşiğinin çok üzerinde olası 42 puandan 35 puan aldığını doğruladı. İkizler 2.5 Deep Assume’ın Çözümleri Rekabet Başkanı Gregor Dolinar tarafından tarif edildi açık, hassas ve birçok durumda, Takip etmek insan rakiplerinden daha kolay.

Bununla birlikte, kullanıcılara yayınlanan Gemini 2.5 derin düşünce aynı rekabet modeli değil, daha düşük performanslı ama görünüşte daha hızlı bir sürüm.

Derin Düşünme Şimdi Nasıl Erişilir

İkizler 2.5 derin düşünce Yalnızca Google AI Extremely Planı’ndaki kullanıcılara iOS ve Android için Google Gemini Cell uygulamasında bulunabilirGoogle One abonelik dizisinin bir parçası, fiyatlandırma aşağıdaki gibi.

  • Promosyon Teklifi: 3 ay boyunca 124.99 $/ay, sonra…
  • Standart Oran: 249,99 $/ay
  • Dahil özellikler: 30 TB depolama, Deep Assume ve Veo 3 ile İkizler uygulamasına erişim ve ayrıca akış, çırpma ve aylık 12.500 AI kredisi gibi araçlar

Aboneler, 2.5 Professional modelini seçerek ve “Derin Düşünce” seçeneğini değiştirerek Deep Assume the Gemini uygulamasında etkinleştirebilir.

Günde sabit sayıda komut istemini destekler ve kod yürütme ve Google arama gibi yeteneklerle entegre edilir. Mannequin ayrıca standart sürümlere kıyasla daha uzun ve daha ayrıntılı çıkışlar üretir.

19,99 $/ay (ücretsiz deneme ile) fiyatlandırılan düşük kademeli Google AI Professional planı, Deep Assume’e erişim veya ücretsiz Gemini hizmetini içermez.

Kurumsal teknik karar vericiler için neden önemlidir?

İkizler 2.5 Deep Assume, büyük bir araştırma kilometre taşının pratik uygulamasını temsil eder.

BT İşletmelerin ve kuruluşların matematik Olimpiyatı madalya kazanan bir modelden yararlanmasına ve personeline katılmasını sağlar, Yalnızca bireysel bir kullanıcı hesabı aracılığıyla da olsa.

Tam IMO-dereceli modelini alan araştırmacılar için, matematikte işbirlikçi yapay zekanın geleceğine bir bakış sunuyor. Extremely aboneler için Deep Assume, şimdi ellerinin avuç içinde koşan daha yetenekli ve bağlam farkında olan AI yardımına yönelik güçlü bir adım sağlar.


avots

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz