Ana Sayfa Teknoloji Google’ın yeni difüzyon AI ajanı, kurumsal araştırmaları geliştirmek için insan yazımını taklit...

Google’ın yeni difüzyon AI ajanı, kurumsal araştırmaları geliştirmek için insan yazımını taklit ediyor

7
0

Gelen kutunuzda daha akıllı bilgiler ister misiniz? Sadece kurumsal AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi abone olun


Google Araştırmacılar geliştirdi Rakip Openai, şaşkınlık ve diğerlerinden lider sistemlerden daha iyi performans gösteren AI araştırma ajanları için yeni çerçeve Anahtar ölçütlerde.

Yeni ajan, Test-Zaman Difüzyon Derin Araştırmacı (TTD-DR), insanların bir taslak hazırlama, bilgi arama ve yinelemeli revizyonlar yaparak yazma biçiminden esinlenmiştir.

Sistem, karmaşık konularda daha kapsamlı ve doğru araştırmalar yapmak için difüzyon mekanizmaları ve evrimsel algoritmalar kullanır.

İşletmeler için bu çerçeve Yüksek değerli görevler için yeni nesil ısmarlama araştırma görevlilerine güç verebilir Bu standart alım artırılmış üretim (RAG) sistemleri, rekabetçi bir analiz veya piyasa giriş raporu oluşturmak gibi mücadele ediyor.


AI ölçeklendirme sınırlarına çarpıyor

Güç kapakları, yükselen belirteç maliyetleri ve çıkarım gecikmeleri kurumsal AI’yı yeniden şekillendiriyor. En iyi takımların nasıl olduğunu keşfetmek için özel salonumuza katılın:

  • Enerjiyi stratejik bir avantaja dönüştürmek
  • Gerçek verim kazanımları için mimar verimli çıkarım
  • Sürdürülebilir AI sistemleriyle rekabetçi yatırım getirisinin kilidini açma

İleride kalmak için yerinizi güvence altına alın:


Makalenin yazarlarına göre, bu gerçek dünyadaki iş kullanım durumları sistem için birincil hedefti.

Mevcut derin araştırma ajanlarının sınırları

Derin araştırma (DR) ajanları, basit bir aramanın ötesine geçen karmaşık sorgularla başa çıkmak için tasarlanmıştır. Planlamak için büyük dil modelleri (LLM’ler) kullanırlar, bilgi toplamak için Net Arama gibi araçları kullanırlar ve daha sonra bulguları, düşünce zinciri (COT), N-Numbling ve Monte-Carlo Ağacı araması gibi check zamanı ölçeklendirme teknikleri ile ayrıntılı bir raporda sentezlerler.

Bununla birlikte, bu sistemlerin çoğunun temel tasarım sınırlamaları vardır. Herkese açık olan DR ajanlarının çoğu, insan bilişsel davranışını yansıtan bir yapı olmadan check zamanı algoritmaları ve araçları uygular. Açık kaynaklı ajanlar genellikle içerik planlama, arama ve üretme konusunda katı doğrusal veya paralel bir süreci takip eder, Araştırmanın farklı aşamalarının birbiriyle etkileşime girmesini ve düzeltmesini zorlaştırır.

Doğrusal Araştırma Temsilcisi Örneği Kaynak: Arxiv

Bu, ajanın araştırmanın küresel bağlamını kaybetmesine ve farklı bilgi parçaları arasındaki kritik bağlantıları kaçırmasına neden olabilir.

Makalenin yazarlarının belirttiği gibi, “Bu, mevcut DR ajanının çalışmasında temel bir sınırlamayı gösterir ve insan araştırma yeteneklerini taklit eden veya aşan DR ajanları için daha uyumlu, amaca yönelik bir çerçeveye ihtiyaç olduğunu vurgular.”

İnsan yazma ve difüzyondan esinlenen yeni bir yaklaşım

Çoğu AI ajanının doğrusal sürecinden farklı olarak, insan araştırmacıları yinelemeli bir şekilde çalışır. Genellikle bir Üst düzey plan, bir ilk taslak oluşturun ve ardından birden fazla revizyon döngüsüne katılın. Bu revizyonlar sırasında, argümanlarını güçlendirmek ve boşlukları doldurmak için yeni bilgiler ararlar.

Google’ın araştırmacıları bunu gözlemledi İnsan süreci bir difüzyon modeli kullanılarak taklit edilebilir bir geri alma bileşeni ile artırılmıştır. (Difüzyon modelleri genellikle görüntü üretiminde kullanılır. Gürültülü bir görüntü ile başlarlar ve ayrıntılı bir görüntü haline gelene kadar yavaş yavaş rafine ederler.)

Araştırmacıların açıkladığı gibi, “Bu benzetmede, eğitimli bir difüzyon modeli başlangıçta gürültülü bir taslak üretir ve geri alma araçlarının desteklendiği denoising modül bu taslağı daha kaliteli (veya daha yüksek çözünürlüklü) çıktılara dönüştürür.”

TTD-DR bu plan üzerine inşa edilmiştir. Çerçeve, bir araştırma raporunun oluşturulmasına, ilk “gürültülü” bir taslağın aşamalı olarak cilalı bir nihai rapora dönüştürüldüğü bir difüzyon süreci olarak ele alınmaktadır.

TTD-DR, ilk araştırma planı kaynağını geliştirmek için yinelemeli bir yaklaşım kullanıyor: ARXIV

Bu iki temel mekanizma ile elde edilir. Araştırmacıların “geri alma ile denoising” dediği birincisi, bir ön taslakla başlar ve yinelemeli olarak geliştirir. Her adımda, ajan mevcut taslağı yeni arama sorguları formüle etmek, harici bilgileri alır ve yanlışlıkları düzelterek ve ayrıntı ekleyerek raporu “denoise” olarak entegre eder.

İkinci mekanizma olan “öz-evrim”, ajanın her bir bileşeninin (planlayıcı, soru jeneratörü ve cevap sentezleyici) kendi performansını bağımsız olarak optimize etmesini sağlar. VentureBeat’e yapılan yorumlarda, Google’daki araştırma bilimcisi ve makalenin ortak yazarı Rujun Han, bu bileşen düzeyinde evrimin çok önemli olduğunu, çünkü “raporu daha etkili hale getirdiğini” açıkladı. Bu, sistemin her bir bölümünün kendi görevinde giderek daha iyi hale geldiği ve ana revizyon süreci için daha yüksek kaliteli bağlam sağladığı evrimsel bir sürece benzer.

TTD-DR’deki bileşenlerin her biri, çoklu yanıtı paralel olarak örneklemek ve hassaslaştırmak ve son olarak birleştirmek için bunları birleştirmek için evrimsel algoritmaları kullanır: Arxiv: Arxiv

Yazarlar, “Bu iki algoritmanın karmaşık etkileşimi ve sinerjistik kombinasyonu yüksek kaliteli araştırma sonuçları elde etmek için çok önemlidir” diyor. Bu yinelemeli süreç doğrudan sadece daha doğru değil, aynı zamanda daha mantıksal olarak tutarlı raporlarla sonuçlanır. Han’ın belirttiği gibi, mannequin akıcılık ve tutarlılığı içeren yardımseverlik üzerinde değerlendirildiğinden, performans kazanımları iyi yapılandırılmış iş belgeleri üretme yeteneğinin doğrudan bir ölçüsüdür.

Makaleye göre, Ortaya çıkan araştırma arkadaşı, “çeşitli endüstri alanlarında karmaşık araştırma soruları için yararlı ve kapsamlı raporlar oluşturabilir, Finans, biyomedikal, rekreasyon ve teknoloji dahil, ”dedi.

TTD-DR eylemde

Araştırmacılar, çerçevelerini oluşturmak ve check etmek için Google’ın Ajan Geliştirme Kitini (ADK), Core LLM olarak Gemini 2.5 Professional ile (diğer modeller için değiştirebilirsiniz) Gemini 2.5 Professional ile genişletilebilir bir platform kullandılar.

TTD-DR’yi Openai Deep Analysis, şaşkınlık derin araştırmaları, Grok DeepSearch ve açık kaynaklı gibi önde gelen ticari ve açık kaynak sistemlerine karşı karşılaştırdılar. GPT-araştırmacı.

Değerlendirme iki ana alana odaklanmıştır. Uzun biçimli kapsamlı raporlar oluşturmak için DeepConsult Benchmarkkendi Longform araştırma veri kümelerinin yanı sıra iş ve danışmanlık ile ilgili bir bilgi koleksiyonu. Kapsamlı arama ve akıl yürütme gerektiren çok hızlı soruları cevaplamak için, ajanı zorlu akademik ve gerçek dünya ölçütleri üzerinde check ettiler. İnsanlığın Son Sınavı (Hle) ve gaia.

Sonuçlar TTD-DR’nin rakiplerinden sürekli olarak daha iyi performans gösterdiğini gösterdi. Uzun biçimli rapor üretimi üzerine Openai Deep araştırmalarıyla yan yana karşılaştırmalarda TTD-DR, iki farklı veri kümesinde% 69.1 ve% 74.5 kazanma oranları elde etti. Ayrıca Openai’nin sistemini,%4,8,%7.7 vepercent1.7 performans kazançlarıyla, kısa cevaplar bulmak için çok hızlı akıl yürütmeyi gerektiren üç ayrı ölçütle aştı.

TTD-DR, Anahtar Kıyaslamalarda Diğer Derin Araştırma Ajanlarından Geri Duyar Kaynak: ARXIV

Take a look at zamanı difüzyonunun geleceği

Mevcut araştırma internet aramasını kullanarak metin tabanlı raporlara odaklanırken, çerçeve oldukça uyarlanabilir olacak şekilde tasarlanmıştır. Han, ekibin karmaşık kurumsal görevler için daha fazla araç dahil etmek için işi genişletmeyi planladığını doğruladı.

A Karmaşık yazılım kodu oluşturmak için benzer “test-zaman difüzyonu” süreci kullanılabilirAyrıntılı bir finansal mannequin oluşturunveya Çok aşamalı bir pazarlama kampanyası tasarlayınprojenin ilk “taslağı” Yeni bilgilerle yinelemeli olarak rafine edilmiş ve çeşitli özel araçlardan geri bildirim.

“Tüm bu araçlar doğal olarak çerçevemize dahil edilebilir,” dedi Han, bu taslak merkezli yaklaşımın çok çeşitli karmaşık, çok aşamalı AI ajanları için temel bir mimari olabileceğini öne sürüyor.


avots

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz