Gelen kutunuzda daha akıllı bilgiler ister misiniz? Sadece kurumsal AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi abone olun
Önde gelen kurumlardan bir araştırmacı ekibi dahil Şangay Jiao Tong Üniversitesi Ve Zhejiang Üniversitesi yapay zeka için ilk “bellek işletim sistemi” dediklerini geliştirdi ve AI sistemlerinin insan benzeri kalıcı hafıza ve öğrenme elde etmesini engelleyen temel bir sınırlamayı ele aldı.
Sistem, arandı Notbelleğin, geleneksel işletim sistemlerinin CPU ve depolama kaynaklarını nasıl yönettiğini nasıl yönettiği gibi, zamanla planlanabilen, paylaşılabilen ve gelişebilecek temel bir hesaplama kaynağı olarak ele alınır. Araştırma, 4 Temmuz’da Arxiv’de yayınlandıOpenai’nin bellek sistemlerine kıyasla geçici akıl yürütme görevlerindeki% 159’luk bir artış da dahil olmak üzere mevcut yaklaşımlar üzerinde önemli performans iyileştirmeleri gösterir.
Araştırmacılar, “Büyük dil modelleri (LLM’ler) yapay genel zeka (AGI) için önemli bir altyapı haline geldi, ancak iyi tanımlanmış bellek yönetim sistemlerinin eksikliği, uzun bağlam akıl yürütmesi, sürekli kişiselleştirme ve bilgi tutarlılığının gelişimini engelliyor.” Onların gazetesi.
AI sistemleri konuşmalarda kalıcı hafızayla mücadele ediyor
Mevcut AI sistemleri, araştırmacıların dediği şeyle karşı karşıyabellek silosu”Sorun-Kullanıcılarla tutarlı, uzun vadeli ilişkileri sürdürmelerini engelleyen temel bir mimari sınırlama. Her konuşma veya oturum esasen sıfırdan başlar, modeller etkileşimler arasında tercihleri, birikmiş bilgi veya davranışsal kalıpları koruyamaz. Bu, bir AI asistanının bir kullanıcının bir sonraki restoranda belirtildiği zaman bahsedildiğinde bahsedilebileceği sinir bozucu bir kullanıcı deneyimi yaratır.
Bazı çözümler gibi Geri Alma Artırılmış Nesil (RAG) Konuşmalar sırasında dış bilgileri çekerek bunu ele almaya çalışın, araştırmacılar bunların “yaşam döngüsü kontrolü olmadan varlıksız çözümler” olduğunu savunuyorlar. Sorun basit bilgi alımından daha derine iniyor – bu, insan belleğinin yaptığı gibi, deneyimlerden gerçekten öğrenebilecek ve gelişebilecek sistemler oluşturmakla ilgilidir.
Ekip, “Mevcut modeller esas olarak statik parametrelere ve kısa ömürlü bağlamsal durumlara güvenerek, kullanıcı tercihlerini izleme veya uzun süreler boyunca bilgiyi güncelleme yeteneklerini sınırlandırıyor” diye açıklıyor. Bu sınırlama, AI sistemlerinin günler veya haftalar kapsayabilecek karmaşık, çok aşamalı iş akışlarında bağlamı koruması beklenen kurumsal ortamlarda özellikle belirgin hale gelir.
Yeni Sistem, AI akıl yürütme görevlerinde dramatik iyileştirmeler sağlar
Not Araştırmacıların dediği şeyle temelde farklı bir yaklaşım sunar “Memküpler”-Farklı bilgi türlerini kapsülleyebilen ve zamanla oluşturulabilen, taşınabilen ve geliştirilebilen standart bellek birimleri. Bunlar, açık metin tabanlı bilgiden parametre düzeyinde adaptasyonlara ve mannequin içindeki aktivasyon durumlarına kadar değişir ve daha önce mevcut olmayan bellek yönetimi için birleşik bir çerçeve oluşturur.
Check Locomo benchmarkBellek yoğun akıl yürütme görevlerini değerlendiren, notlar tüm kategorilerde yerleşik taban çizgilerini sürekli olarak daha iyi performans gösterdi. Sistem, Openai’nin hafıza uygulamasına kıyasla% 38,98’lik bir gelişme sağladı ve özellikle birden fazla konuşma dönüşüne bilgi bağlamasını gerektiren karmaşık akıl yürütme senaryolarında güçlü kazançlar vardı.
Araştırmaya göre, “Notlar (Memos-0630), MEM0, LangMem, Zep ve Openai-Reminiscence gibi güçlü temel çizgilerden daha iyi performans gösteren tüm kategorilerde sürekli olarak sıralanıyor. Sistem ayrıca, yenilikçi KV-Cache bellek enjeksiyon mekanizması yoluyla belirli konfigürasyonlarda ilk kez gecikme gecikmesinde% 94’e kadar azalma ile önemli verimlilik iyileştirmeleri sağladı.
Bu performans kazanımları, bellek darboğazının daha önce anlaşılandan daha önemli bir sınırlama olduğunu göstermektedir. Belleği birinci sınıf bir hesaplama kaynağı olarak ele alarak, Not Daha önce mimari sınırlamalarla kısıtlanmış olan akıl yürütme yeteneklerinin kilidini açıyor gibi görünüyor.
Teknoloji, işletmelerin yapay zekayı nasıl kullandığını yeniden şekillendirebilir
Kurumsal AI dağıtımının sonuçları, özellikle işletmeler, müşteriler ve çalışanlarla karmaşık, devam eden ilişkiler için AI sistemlerine giderek daha fazla güvenirken dönüştürücü olabilir. Not araştırmacıların “Platformlar arası bellek geçişi”AI anılarının farklı platformlarda ve cihazlarda taşınabilir olmasına izin vermek, dediklerini parçalayarak”Hafıza Adaları”Şu anda kullanıcı bağlamını belirli uygulamalarda tuzağa düşüren.
Bir yapay zeka platformunda araştırılan bilgiler diğerine taşıyamadığında birçok kullanıcının yaşadığı mevcut hayal kırıklığını düşünün. Bir pazarlama ekibi, sadece kampanya planlaması için farklı bir AI aracına geçerken sıfırdan başlamak için ChatGPT ile yapılan görüşmeler yoluyla ayrıntılı müşteri kişileri geliştirebilir. Notlar, sistemler arasında hareket edebilen standart bir bellek formatı oluşturarak bunu ele alır.
Araştırma ayrıca “Ücretli Bellek Modülleri”Area uzmanlarının bilgilerini satın alınabilir bellek birimlerine paketleyebileceği yerlerde. Araştırmacılar,“ klinik rotasyonda bir tıp öğrencisi nadir bir otoimmün durumun nasıl yönetileceğini incelemek isteyebilecekleri senaryolar öngörüyorlar. Deneyimli bir doktor, teşhis sezgisel tarlalarını, sorgulama yollarını ve tipik vaka kalıplarını yapılandırılmış bir hafızaya kapsar ”.
Bu pazar modeli, AI sistemlerinde uzmanlaşmış bilginin nasıl dağıtıldığını ve para kazanıldığını temelden değiştirerek, yüksek kaliteli alan bilgisine erişimi demokratikleştirirken uzmanlar için yeni ekonomik fırsatlar yaratabilir. İşletmeler için bu, özel eğitim ile ilişkili geleneksel maliyetler ve zaman çizelgeleri olmadan belirli alanlarda derin uzmanlığa sahip AI sistemlerinin hızla dağıtılması anlamına gelebilir.
Üç katmanlı tasarım geleneksel bilgisayar işletim sistemlerini yansıtıyor
. notların teknik mimarisi AI bellek yönetiminin benzersiz zorluklarına uyarlanmış geleneksel işletim sistemi tasarımından onlarca yıllık öğrenmeyi yansıtır. Sistem üç katmanlı bir mimari kullanır: API çağrıları için bir arayüz katmanı, bellek planlaması ve yaşam döngüsü yönetimi için bir çalışma katmanı ve depolama ve yönetişim için bir altyapı katmanı.
Sistemin Memscheduler Bileşen, geçici aktivasyon durumlarından kalıcı parametre modifikasyonlarına kadar farklı bellek türlerini dinamik olarak yönetir – kullanım kalıplarına ve görev gereksinimlerine göre optimum depolama ve geri alma stratejilerinin seçilmesi. Bu, tipik olarak belleği tamamen statik (mannequin parametrelerine gömülü) veya tamamen geçici (konuşma bağlamıyla sınırlı) olarak gören mevcut yaklaşımlardan önemli bir ayrılmayı temsil eder.
“Odak, modelin ne kadar bilgi öğrendiğinden, deneyimi yapılandırılmış belleğe dönüştürüp dönüştüremeyeceği ve tekrar tekrar alıp yeniden inşa edip etmeyeceğinden geçiyor” diyor araştırmacılar, dediklerine ilişkin vizyonlarını açıklıyor ”dedi.Mem eğitimi“Paradigmalar. Bu mimari felsefe, AI sistemlerinin nasıl tasarlanması gerektiğine dair temel bir yeniden düşünmeyi öneriyor ve mevcut büyük antrenman paradigmasından daha dinamik, deneyim odaklı öğrenmeye doğru uzaklaşıyor.
İşletim sistemi gelişimine paralellikler dikkat çekicidir. Erken bilgisayarların programcıların bellek tahsisini manuel olarak yönetmelerini gerektirdiği gibi, mevcut AI sistemleri geliştiricilerin bilginin farklı bileşenler arasında nasıl aktığını dikkatlice düzenlemelerini gerektirir. Not Bu karmaşıklığı soyutlar, potansiyel olarak derin teknik uzmanlık gerektirmeden sofistike bellek yönetiminin üzerine inşa edilebilen yeni nesil AI uygulamalarını mümkün kılar.
Araştırmacılar, evlat edinmeyi hızlandırmak için açık kaynak olarak kodu yayınlayın
Takım serbest bıraktı Not Açık kaynaklı bir proje olarak Github’da tam kod mevcut ve Huggingface, Openai ve Ollama dahil olmak üzere büyük AI platformları için entegrasyon desteği. Bu açık kaynak stratejisi, yaygın uygulamayı sınırlayabilecek tescilli bir yaklaşım yürütmek yerine, benimsemeyi hızlandırmak ve teşvik etmek için tasarlanmıştır.
Venture Lider Zhiyu Li, GitHub deposunda “Notların AI sistemlerinin statik jeneratörlerden sürekli gelişen, bellek güdümlü ajanlara ilerlemesine yardımcı olduğunu umuyoruz” dedi. Sistem şu anda Linux platformlarını destekliyor, Home windows ve macOS desteği planlandı ve ekibin kurumsal ve geliştiricinin anında tüketiciye erişilebilirliğine göre benimsenmesine öncelik verdiğini gösteriyor.
Açık kaynaklı yayın stratejisi, tüm ekosisteme fayda sağlamak için temel altyapı iyileştirmelerinin açıkça paylaşıldığı AI araştırmalarında daha geniş bir eğilimi yansıtmaktadır. Bu yaklaşım, derin öğrenme çerçeveleri gibi alanlarda tarihsel olarak inovasyonu hızlandırmıştır ve AI sistemlerinde hafıza yönetimi için benzer etkilere sahip olabilir.
Teknoloji devleri AI bellek sınırlamalarını çözmek için yarışıyor
Araştırma, büyük AI şirketleri mevcut bellek yaklaşımlarının sınırlamalarıyla boğuşurken, bu zorluğun endüstri için ne kadar temel olduğunu vurgulamaktadır. Openai yakın zamanda tanıtıldı Chatgpt için bellek özelliklerisırasında Antropik– Googleve diğer sağlayıcılar çeşitli kalıcı bağlam biçimlerini denediler. Bununla birlikte, bu uygulamalar genellikle kapsamı sınırlıdır ve genellikle sistematik yaklaşımdan yoksun Not sağlar.
Bu araştırmanın zamanlaması, bellek yönetiminin AI gelişiminde kritik bir rekabetçi savaş alanı olarak ortaya çıktığını göstermektedir. Bellek problemini etkili bir şekilde çözebilen şirketler, AI sistemleri zaman içinde daha derin, daha yararlı ilişkiler kurabildiğinden, kullanıcının elde tutma ve memnuniyetinde önemli avantajlar sağlayabilir.
Endüstri gözlemcileri, AI’daki bir sonraki büyük atılımın mutlaka daha büyük modellerden veya daha fazla eğitim verisinden değil, insan bilişsel yeteneklerini daha iyi taklit eden mimari yeniliklerden geleceğini tahmin ediyorlar. Bellek yönetimi tam olarak bu tür temel ilerlemeyi temsil eder – yeni uygulamaların kilidini açabilecek ve mevcut durumsuz sistemlerle mümkün olmayan durumları kullanabilir.
Gelişme, AI araştırmalarında zaman içinde bilgiyi biriktirebilen ve geliştirebilen daha durumsal, kalıcı sistemlere doğru daha geniş bir değişimin bir kısmını temsil etmektedir – yapay genel zeka için gerekli görülen yetenekler. AI uygulamalarını değerlendiren kurumsal teknoloji liderleri için, Not her bir etkileşimi izole edildiği gibi tedavi etmek yerine, bağlamı koruyan ve zaman içinde iyileştiren AI sistemleri oluşturmada önemli bir ilerlemeyi temsil edebilir.
Araştırma ekibi, modeller arası bellek paylaşımını, kendi kendini geliştiren bellek bloklarını ve gelecekteki çalışmalarda daha geniş bir “bellek pazarı” ekosisteminin geliştirilmesini keşfetmeyi planladıklarını gösteriyor. Ancak belki de notların en önemli etkisi belirli teknik uygulama olmayacaktır, bunun yerine belleğin birinci sınıf bir hesaplama kaynağı olarak ele alınmasının AI yeteneklerinde dramatik iyileştirmelerin kilidini açabileceğinin kanıtı. Büyük ölçüde mannequin boyutunu ve eğitim verilerini ölçeklendirmeye odaklanan bir sektörde, notlar bir sonraki atılımın daha büyük bilgisayarlardan ziyade daha iyi mimariden gelebileceğini gösteriyor.
avots