Google DeepMind, şirketin en gelişmiş AI akıl yürütme modeli olduğunu söyleyen Gemini 2.5 Deep Assume’i kullanıyor, aynı anda birden fazla fikri keşfederek ve düşünerek soruları cevaplayabiliyor ve daha sonra bu çıktıları en iyi cevabı seçmek için kullanıyor.
Google’ın ayda 250 dolarlık extremely aboneliğine aboneler, Cuma günü başlayan İkizler uygulamasında Gemini 2.5 Deep Assume’e erişecek.
İlk olarak Mayıs ayında Google I/O 2025’te tanıtılan Gemini 2.5 Deep Assume, Google’ın halka açık ilk çok ajan modelidir. Bu sistemler, tek bir ajandan önemli ölçüde daha fazla hesaplama kaynağı kullanan, ancak daha iyi cevaplarla sonuçlanma eğiliminde olan bir süreç olan bir soruyu paralel olarak ele almak için AI çok ajanları ortaya çıkarır.
Google, bu yılki Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya kazanmak için Gemini 2.5 Deep Düşüncesi varyasyonunu kullandı.
Gemini 2.5 Deep Assume’in yanı sıra şirket, IMO’da kullandığı modeli belirli bir grup matematikçi ve akademisyen grubuna bıraktığını söylüyor. Google, bu AI modelinin çoğu tüketiciye bakan AI modeli gibi saniyeler veya dakikalar yerine “akıl yürütmesi” diyor. Şirket, IMO modelinin araştırma çabalarını artıracağını umuyor ve akademik kullanım durumları için çok ajan sistemin nasıl geliştirileceği konusunda geri bildirim almayı amaçlıyor.
Google, Gemini 2.5 derin düşünce modelinin G/Ç’de açıklandığı konusunda önemli bir gelişme olduğunu belirtiyor. Şirket ayrıca Gemini 2.5 derin düşünmeyi teşvik etmek için “yeni takviye öğrenme teknikleri” geliştirdiğini iddia ediyor.
Google, TechCrunch ile paylaşılan bir weblog gönderisinde “Deep Assume, insanların yaratıcılık, stratejik planlama ve iyileştirmeler gerektiren sorunlarla mücadele etmelerine yardımcı olabilir” dedi.
TechCrunch Etkinliği
San Francisco
|
27-29 Ekim 2025
Şirket, Gemini 2.5 Deep Assume’in, AI’nın matematik, beşeri bilimler ve bilim boyunca binlerce kitle kaynaklı soruyu cevaplama yeteneğini ölçen zorlu bir check olan insanlığın son sınavında (HLE) son teknoloji ürünü performans elde ettiğini söylüyor. Google, modelininpercent25.4 puan alan Xai’nin GROK 4’üne ve Openai’nin O3’üne kıyasla HLE’depercent34.8 (aletsiz) vepercent20,3 puan alan Openai O3 puan aldığını iddia ediyor.
Google ayrıca Gemini 2.5 Deep Assume, rekabetçi kodlama görevlerinin zorlu bir testi olan LiveCodeBench6’da Openai, Xai ve Antropik’ten AI modellerinden daha iyi performans gösteriyor. Google’ın modelipercent87,6, Grook 4percent79, Openai’nin O3’üpercent72 puan aldı.
Gemini 2.5 Deep Tuse, kod yürütme ve Google arama gibi araçlarla otomatik olarak çalışır ve şirket, geleneksel AI modellerinden “çok daha uzun yanıtlar” üretebileceğini söylüyor.
Google’ın testlerinde mannequin, diğer AI modellerine kıyasla daha ayrıntılı ve estetik açıdan hoş internet geliştirme görevleri üretti. Şirket, modelin araştırmacılara yardımcı olabileceğini ve “potansiyel olarak keşif yolunu hızlandırabileceğini” iddia ediyor.

Önde gelen birkaç AI laboratuvarı çok ajan yaklaşımı etrafında birleşiyor gibi görünüyor.
Elon Musk’tan Xai kısa bir süre önce, birkaç ölçütle endüstride lider performans elde edebildiğini söyleyen kendi çok ajanlı Grok 4 Heavy’i yayınladı. Openai araştırmacısı Noam Brown, podcast Bu yılki Uluslararası Matematik Olimpiyatı’nda (IMO) şirketin altın madalya elde etmek için kullandığı yayınlanmamış AI modelinin de çok ajan bir sistemdi. Bu sırada, Antropik Araştırma AcentesiKapsamlı araştırma özetleri üreten, çok ajan bir sistemle de güçlendirilir.
Güçlü performansa rağmen, çok ajan sistemlerin geleneksel AI modellerinden daha pahalıya daha pahalı olduğu görülmektedir. Bu, teknoloji şirketlerinin bu sistemleri Xai ve şimdi Google’ın yapmayı seçtiği en pahalı abonelik planlarının arkasında tutabileceği anlamına geliyor.
Önümüzdeki haftalarda Google, Gemini 2.5 Deep Assume’i Gemini API’si aracılığıyla seçkin bir testçi grubuyla paylaşmayı planladığını söylüyor. Şirket, geliştiricilerin ve işletmelerin çok ajan sistemini nasıl kullanabileceğini daha iyi anlamak istediğini söylüyor.