Ana Sayfa Teknoloji Deep Cogito büyüyor, 4 yeni açık kaynaklı hibrit akıl yürütme modeli kendi...

Deep Cogito büyüyor, 4 yeni açık kaynaklı hibrit akıl yürütme modeli kendi kendini geliştiren ‘sezgi’

11
0

Gelen kutunuzda daha akıllı bilgiler ister misiniz? Sadece kurumsal AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi abone olun


Ex-Googlers tarafından kurulan San Francisco merkezli daha az bilinen bir AI araştırma şirketi olan Deep Cogito Bugün dört yeni Open-ish Büyük Dil Modeli (LLMS) yayınladı Bu, birkaç kişinin yaptığı bir şeyi dener: zamanla nasıl daha etkili bir şekilde akıl yürütmeyi öğrenin – ve kendi başlarına daha iyi hale gelin.

Modeller, Cogito’nun V2 ailesinin bir parçası olarak yayınlandı, 70 milyar ila 671 milyar parametre arasında değişir ve AI geliştiricilerinin ve işletmelerinin sınırlı ve tamamen açık lisanslama terimlerinin bir karışımı altında kullanmaları için kullanılabilir. Bunlar şunları içerir:

  • Cogito v2-70b (yoğun)
  • Cogito V2-109B (Ekspertlerin Karışımı)
  • Cogito v2-405b (yoğun)
  • Cogito V2-671b (Experpts karışımı)

Cogito V2 serisi her ikisini de içerir yoğun Ve Specialists karışımı (MOE) Her biri farklı ihtiyaçlara uygun modeller. 70b ve 405B varyantları gibi yoğun modeller, her ileri geçişteki tüm parametreleri etkinleştirerek, bunları daha öngörülebilir ve çok çeşitli donanımlarda dağıtılmasını kolaylaştırır.

İçin idealdirler Düşük gecikme uygulamaları, ince ayar ve sınırlı GPU kapasitesine sahip ortamlar. 109B ve 671B sürümleri gibi MOE modelleri, bir seferde sadece birkaç özel “uzman” alt ağını etkinleştirmek için seyrek bir yönlendirme mekanizması kullanır ve çok şey sağlar. Daha büyük toplam mannequin boyutları Hesaplama maliyetinde orantılı artışlar olmadan.


AI Etki Serisi San Francisco’ya Dönüyor – 5 Ağustos

Yapay zekanın bir sonraki aşaması burada – hazır mısınız? Otonom ajanların kurumsal iş akışlarını nasıl yeniden şekillendirdiğine özel bir bakış için Block, GSK ve SAP’den liderlere katılın-gerçek zamanlı karar vermeden uçtan uca otomasyona kadar.

Şimdi yerinizi sabitleyin – Alan Sınırlı:


Bu onları çok uygun hale getirir Yüksek performanslı çıkarım görevlerikarmaşık akıl yürütme veya hizmet hakkında araştırma Daha düşük çalışma zamanı gideride sınır seviyesi doğruluğu. Cogito V2’de, 671B MOE modeli amiral gemisi görevi görür, ölçeğini ve yönlendirme verimliliğinden yararlanır ve önemli ölçüde daha kısa akıl yürütme zincirlerini kullanarak ölçümlerde önde gelen açık modelleri eşleştirir.

Şimdi mevcutlar Sarılma Yüzü İndirme ve İşletmeler tarafından kullanım için ve Yerel kullanım içinveya mannequin çıkarımlarını kendi donanımlarında barındıramayanlar için, uygulama programlama arayüzleri (API’ler) Birlikte AIBaseten Ve Runpod.

Ayrıca nicelikli bir “8 bit yüzen nokta (FP8)”671B modelinin, modelin parametrelerini temsil etmek için kullanılan sayıların boyutunu 16 bitten 8 bitten 8 bitlere düşüren versiyonu, kullanıcıların büyük modelleri daha hızlı, daha ucuz ve daha erişilebilir donanımlarda çalıştırmasına yardımcı-bazen sadece ihmal edilebilir bir performansa,%95-99. Ancak, bu. mannequin doğruluğunu biraz bozabilirözellikle ince taneli hassasiyet gerektiren görevler için (örneğin, bazı matematik veya akıl yürütme problemleri).

Dört cOgito V2 modelleri hibrid akıl yürütme sistemleri olarak tasarlanmıştır: hemen bir sorguya yanıt verebilir veya gerektiğinde cevap vermeden önce dahili olarak yansıabilirler.

En önemlisi, bu yansıma sadece çalışma zamanı davranışı değildir, aynı zamanda eğitim sürecinin kendisine pişirilir.

Bu modeller kendi akıl yürütmelerini içselleştirmek için eğitilmiştir. Bu, cevaplara ulaşmak için attıkları yolların – tabiri caizse – modellerin ağırlıklarına geri damıtıldığı anlamına gelir.

Mesai, Hangi düşünce çizgilerinin gerçekte ve hangilerinin önemli olduğunu öğrenirler.

Deep Cogito’nun weblog yazısı belirttiği gibi, araştırmacılar “modeli” daha fazla kıvrımdan “cevap verebilmek için farklılaştırıyor ve bunun yerine akıl yürütme süreci için doğru arama yörüngesi için daha güçlü bir sezgi geliştiriyorlar.”

Sonuç, derin cogito iddia ediyor, daha hızlı, daha verimli akıl yürütme ve performansta genel bir iyileşme, “Standart” modda bile.

Kendini geliştiren yapay zeka

AI topluluğundaki birçok kişi şimdi şirketle karşılaşırken, Deep Cogito bir yıldan fazla bir süredir sessizce inşa ediyor.

Şirket, Nisan 2025’te Stealth’den Meta’s Llama 3.2’de eğitilmiş bir dizi açık kaynaklı modelle ortaya çıktı. Bu erken sürümler umut verici sonuçlar gösterdi.

Gibi VentureBeat Daha önce bildirilen en küçük Cogito V1 modelleri (3b ve 8b), bazen geniş marjlarla – birkaç ölçüt boyunca Lama 3 karşılaşmalarından daha iyi performans gösterdi.

Deep Cogito CEO ve kurucu ortağı Drishan Arora -Daha önce Google’da bir lider LLM mühendisi-şirketin uzun vadeli hedefini bina olarak tanımladı Her yinelemeyi akıl yürütebilecek ve geliştirebilecek modellerAlphaGo’nun stratejisini kendi kendine oynayarak nasıl geliştirdiği gibi.

Deep Cogito’nun temel yöntemi, yinelenmiş damıtma ve amplifikasyon (IDA), elle yazılmış istemlerin veya statik öğretmenlerin modelin kendi gelişen anlayışlarıyla değiştirilir.

‘Makine Sezgisi’ nedir?

Cogito V2 ile ekip bu döngüyü çok daha büyük bir ölçeğe götürdü. Merkezi fikir basittir: Akıl yürütme sadece bir çıkarım zamanı aracı olmamalı, modelin temel zekasının bir parçası olmalıdır.

Böylece şirket, modelin eğitim sırasında akıl yürütme zincirlerini çalıştırdığı ve daha sonra kendi ara düşünceleri üzerinde eğitildiği bir sistem uyguladı.

Bu işlem, dahili kriterlere göre somut iyileştirmeler sağlar. Amiral gemisi 671b Specialists (MOE) modeli,% 60 daha kısa akıl yürütme zincirlerini kullanırken en son 0528 modelini eşleştirerek veya yenerek Deepseek R1’den daha iyi performans gösterir.

MMLU, GSM8K ve MGSM’de Cogito 671b Moe’nin performansı kabaca Qwen1.5-72b ve Deepseek V3 gibi en iyi açık modellerle eşitti ve Claude 4 Opus ve O3 gibi kapalı modellerin performans katmanına yaklaştı.

Özellikle:

  • Cogito 671b MOE (Akıl Yürütme Modu) Çok dilli KG ve genel bilgi görevleri boyunca Deepseek R1 0528 ile eşleşti ve strateji ve mantıksal kesinti konusunda daha iyi performans gösterdi.
  • Mahkaris olmayan moddaDeepseek V3 0324’ü aştı, bu da damıtılmış sezginin geniş bir akıl yürütme yolu olmadan bile gerçek performans ağırlığı taşıdığını düşündürdü.
  • Modelin akıl yürütmeyi daha az adımda tamamlama yeteneğinin de aşağı yönlü etkileri vardı: daha düşük çıkarım maliyetleri ve karmaşık istemlerde daha hızlı yanıt süreleri.

Arora bunu, hedefin nerede olduğunu kabaca bilmekle birlikte bir yol aramak ile zaten bilmek arasında bir fark olarak açıklıyor.

“Cogito modelleri, çıkarım zamanında arama yaparken alınacak yörüngenin daha iyi bir sezgisi geliştirdiğinden, Deepseek R1’den% 60 daha kısa akıl yürütme zincirleri var” diye yazdı x üzerindeki bir iş parçacığında Yeni V2 modellerini duyuruyor.

Deep Cogito’nun yeni modelleri makine sezgilerini kullanırken ne tür görevler mükemmel?

Cogito V2’nin dahili testinden en ilgi çekici örneklerden bazıları, bunun kullanımda nasıl ortaya çıktığını tam olarak vurgulamaktadır.

Matematik ağır bir istemde, bir kullanıcı 80 mil / saat hızla seyahat eden bir trenin 2,5 saatin altında 240 mil uzakta bir şehre ulaşıp ulaşamayacağını sorar.

Birçok mannequin hesaplamayı adım adım simüle ederken ve bazen birim dönüşüm hataları yaparken, Cogito 671b dahili olarak yansıtır, 240 ÷ 80 = 3 saat olduğunu belirler ve trenin doğru bir şekilde sonucuna varır yapamamak Zamanında var. Bunu, aynı cevaba ulaşmak için Deepseek R1 tarafından kullanılan 200+ ile karşılaştırıldığında sadece kısa bir iç akıl yürütme izi ile – 100 belirteç altında – yapar.

Yasal akıl yürütmeyi içeren başka bir örnekte, bir kullanıcı, belirli bir ABD Yüksek Mahkemesi kararının arama ve nöbet içeren varsayımsal bir dava uygulanıp uygulanmayacağını sorar. Cogito’nun akıl yürütme modu iki aşamalı bir mantığı vurgular: önce varsayımcının emsalle eşleşip eşleşmediğini belirlemek, ardından neden olduğunu veya yapmadığını açıklamak. Mannequin, açık bir gerekçe ile nüanslı bir cevaba ulaşır – birçok LLM’nin hala mücadele ettiği bir tür yorumlayıcı akıl yürütme.

Diğer görevler belirsizliği ele almada iyileştirmeler göstermektedir. Klasik çok hızlı bir soru-“Alice Bob’un annesi ise ve Bob Charlie’nin babasıysa, Alice Charlie’ye nedir?” – Modeller genellikle zamirlere karışır. Cogito V2’nin modelleri, Alice’i Charlie’nin büyükannesi olarak doğru bir şekilde tanımlıyor, hatta diğer açık modellerin hafiflettiği biraz yeniden verilen varyantlarda bile.

Ölçekte verimlilik

Yeni modellerin büyük boyutuna rağmen, Deep Cogito, daha küçük V1 kontrol noktaları da dahil olmak üzere sekiz Cogito modelinin hepsini, rapor edilene kıyasla toplam 3,5 milyon doların altında eğittiğini iddia ediyor. Openai’nin önde gelen modelleri için 100 milyon dolar artı.

Buna veri üretimi, sentetik takviye, altyapı ve 1.000’den fazla eğitim deneyi dahildir. Diğer sınır modellerinin dokuz rakamlı bütçelerine kıyasla, tipik harcamaların bir kısmıdır.

Arora, bu tutkunu şirketin temel tezine bağlar: Akıllı modeller daha fazla jeton değil, daha iyi önceliklere ihtiyaç duyar.

Modelin gereksiz veya yanıltıcı akıl yürütme yollarını atlamayı öğreterek Cogito V2, boşaltma süresi olmadan daha güçlü bir performans sunar.

Bu, API altyapısında veya gecikme ve maliyetin önemli olduğu Edge cihazlarında modeller çalıştıran kullanıcılar için anlamlı bir değiş tokuş.

Deep Cogito ve V2 için sırada ne var?

Cogito V2’nin piyasaya sürülmesi son bir ürün değil, yinelemeli bir adımdır. Arora, şirketin yol haritasını “tepe tırmanışı” olarak tanımlıyor. Zamanla, her mannequin bir sonraki için bir basamak taş haline gelir.

Deep Cogito’nun yayınladığı her mannequin açık kaynak ve şirket bunun gelecekteki yinelemeler için geçerli olacağını söylüyor.

Zaten çalışmaları, Benchmark’ın Eric Vishria ve South Park Commons’un Aditya Agarwal gibi destekçilerinin dikkatini ve desteğini çekti.

Altyapı ortakları arasında Hugging Face, birlikte AI, Runpod, Baseten, Meta’nın lama ekibi ve unsloth yer alıyor.

Geliştiriciler, araştırmacılar ve kurumsal ekipler için, Modeller şimdi mevcut. Geliştiriciler Bunları yerel olarak çalıştırabilir, modları karşılaştırabilir veya belirli kullanım durumları için ince ayar yapabilir.

Ve daha geniş açık kaynaklı AI topluluğu için Cogito V2, yeni bir kıyaslama kazananından daha fazlasını sunuyor-istihbarat inşa etmenin farklı bir yolunu öneriyor. Daha sert düşünerek değil, nasıl daha iyi düşünmeyi öğrenerek.


avots