Ana Sayfa Teknoloji QWEN3-Coder-480B-A35b-Engelleme lansmanları ve ‘henüz en iyi kodlama modeli olabilir’

QWEN3-Coder-480B-A35b-Engelleme lansmanları ve ‘henüz en iyi kodlama modeli olabilir’

9
0

Gelen kutunuzda daha akıllı bilgiler ister misiniz? Sadece kurumsal AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi abone olun


Çin e-ticaret devi Alibaba’nın “Qwen Crew” tekrar yaptı.

Ücretsiz ve açık kaynaklı lisansla serbest bırakıldıktan sadece günler sonra Şimdi dünyada en iyi performans göstermeyen büyük dil modeli (LLM) -Tam durak, Google ve Openai gibi iyi finanse edilen ABD laboratuvarlarından tescilli AI modellerine kıyasla-uzun süredir adlandırılan Qwen3-235B-A22B-2507 şeklinde, bu AI araştırmacısı grubu başka bir gişe rekorları kıran modelle ortaya çıktı.

Yani Qwen3-Code-480b-A35b-İncremc Yeni bir Açık kaynaklı LLM, yazılım geliştirmeye yardımcı olmaya odaklandı. Karmaşık, çok aşamalı kodlama iş akışlarını işlemek için tasarlanmıştır ve saniye veya dakikalar.

Mannequin, aracı kodlama görevlerinde Claude Sonnet-4 gibi tescilli tekliflerle rekabet edebilecek ve açık modeller arasında yeni kıyaslama puanları ayarlayacak şekilde konumlandırılmıştır.

Şu anda mevcut Sarılma YüzüGitithubQwen sohbetaracılığıyla Alibaba’nın Qwen API’sive üçüncü taraf vibe kodlama ve AI araç platformlarının büyüyen bir listesi.

Açık Kaynak lisanslama, işletmeler için düşük maliyet ve yüksek seçenek anlamına gelir

Ancak Claude ve diğer tescilli modellerden farklı olarak, kısaca arayacağımız Qwen3-Coder, şimdi bir Açık Kaynak Apache 2.0 Lisansıyani herhangi bir işletmenin Alibaba veya başka bir kuruş ödemeden çalışanlar veya son müşteriler için ticari uygulamalarında ücret almadan, indirmesi, değiştirmesi, dağıtması ve kullanması ücretsizdir.

Aynı zamanda, AI Energy kullanıcıları arasında “vibe kodlama” için üçüncü taraf ölçümlerde ve anekdot kullanımında çok performanslıdır-doğal dil kullanarak ve resmi geliştirme süreçleri ve adımları olmadan-en azından biri olan-en azından bir tane- LLM araştırmacısı Sebastian RaschkaX üzerine şunu yazdı: “Bu şimdiye kadarki en iyi kodlama modeli olabilir. Genel amaçlı havalı, ancak kodlamada en iyisini istiyorsanız, uzmanlaşma kazanır. Ücretsiz öğle yemeği yok.”

İndirmekle ilgilenen geliştiriciler ve işletmeler, AI Kodu Paylaşım Deposunda kodu bulabilir Sarılma Yüzü.

Modeli kendi başlarına veya çeşitli üçüncü taraf bulut çıkarım sağlayıcılarıyla barındırma kapasitesine sahip olmayan veya istemeyen işletmeler de doğrudan kullanabilir. Alibaba Cloud Qwen API aracılığıylamilyonlarca jeton maliyetleri 32.000 jetona kadar girdi/çıktı için milyon jeton başına 1/5 $ ‘dan (MTOK), daha sonra 128.000’e kadar 1.8/9 $, 256.000’e kadar 3/15 $ ve tam milyon için 6 $/60 $’ dan başlıyor.

Mannequin mimarisi ve yetenekleri

Qwen Crew On-line tarafından yayınlanan belgelere göre, Qwen3-Coder, 480 milyar toplam parametreye, sorgu başına 35 milyar aktif ve 160’dan 8 aktif uzmana sahip bir Specialists karışımı (MOE) modelidir.

256K jeton bağlam uzunluklarını doğal olarak destekler, iplik kullanan 1 milyon jetona kadar ekstrapolasyon (yine başka bir halat ekstrapolasyonu – bir dil modelinin bağlam uzunluğunu, dikkat hesaplaması sırasında kullanılan döner konumsal embeddingleri (ipi) değiştirerek orijinal eğitim sınırının ötesine uzatmak için kullanılan bir teknik olarak destekler. Bu kapasite, modelin tek bir geçişte tüm depoları veya büyük belgeleri anlamasını ve manipüle etmesini sağlar.

Nedensel bir dil modeli olarak tasarlanan 62 kat, sorgular için 96 dikkat kafası ve anahtar değeri çiftleri için 8’e sahiptir. Token verimli, talimat takip eden görevler için optimize edilmiştir ve desteği atlar Varsayılan olarak bloklar, çıktılarını kolaylaştırır.

Yüksek performans

Qwen3-Coder, çeşitli ajan değerlendirme süitlerinde açık modeller arasında öncü performans elde etti:

  • SWE-Bench doğrulandı:% 67.0 (standart),% 69.6 (500-dönüş)
  • GPT-4.1:% 54.6
  • Gemini 2.5 Professional Önizleme:% 49.0
  • Claude Sonnet-4:% 70.4

Mannequin ayrıca, aracı tarayıcı kullanımı, çok dilli programlama ve takım kullanımı gibi görevler arasında rekabetçi bir şekilde puan alır. Görsel kriterler, kod oluşturma, SQL programlama, kod düzenleme ve talimat gibi kategorilerdeki eğitim yinelemeleri arasında aşamalı bir gelişme göstermektedir.

Modelin yanı sıra Qwen, Gemini kodundan çatallanmış bir CLI aracı olan açık kaynaklı Qwen koduna sahiptir. Bu arabirim, işlev çağrısını ve yapılandırılmış istasyonunu destekleyerek Qwen3 kodlayı kodlama iş akışlarına entegre etmeyi kolaylaştırır. Qwen kodu Node.js ortamlarını destekler ve NPM üzerinden veya kaynaktan yüklenebilir.

Qwen3-Coder ayrıca şu şekilde geliştirici platformlarıyla bütünleşir:

  • Claude Kodu (Dashscope Proxy veya Yönlendirici Özelleştirme aracılığıyla)
  • Cline (Openai uyumlu bir arka uç olarak)
  • Ollama, Lmstudio, MLX-LM, Lama.cpp ve Ktransformers

Geliştiriciler, Alibaba Cloud’da barındırılan uç noktaları kullanarak qwen3 kodlayıcıyı yerel olarak çalıştırabilir veya Openai uyumlu API’ler aracılığıyla bağlanabilir.

Eğitim Sonrası Teknikler: Kod RL ve Uzun Horizon Planlama

7,5 trilyon jeton (% 70 kod) üzerinde ön hazırlık yapmanın yanı sıra, qwen3 kodlayıcı, eğitim sonrası gelişmiş tekniklerden yararlanır:

  • Kod RL (Takviye Öğrenimi): Çeşitli, doğrulanabilir kod görevlerinde yüksek kaliteli, yürütme odaklı öğrenmeyi vurgular
  • Lengthy-Horizon Agent RL: Modeli planlamak, araçları kullanmak ve çok dönüş etkileşimlerine uyum sağlamak için eğitiyor

Bu aşama gerçek dünyadaki yazılım mühendisliği zorluklarını simüle ediyor. Bunu etkinleştirmek için Qwen, Alibaba Cloud’da 20.000 çevre sistemi oluşturdu ve SWE-Bench’te bulunanlar gibi karmaşık iş akışlarında modelleri değerlendirmek ve eğitmek için gerekli ölçeği sunuyor.

İşletme Çıkarları: Mühendislik ve DevOps iş akışları için yapay zeka

İşletmeler için Qwen3-Coder, kapalı kaynaklı tescilli modellere açık, son derece yetenekli bir alternatif sunuyor. Kodlama yürütme ve uzun bağlam akıl yürütmesinde güçlü sonuçlarla, özellikle aşağıdakiler için geçerlidir.

  • Kod tabanı düzeyinde anlayış: Büyük depoları, teknik belgeleri veya mimari kalıpları anlaması gereken AI sistemleri için supreme
  • Otomatik çekme isteği iş akışları: Dönüşler boyunca planlama ve uyum sağlama yeteneği, onu otomatik oluşturma veya çekme isteklerini gözden geçirmeye uygun hale getirir
  • Araç entegrasyonu ve düzenleme: Yerel takım çağrısı API’leri ve işlev arayüzü aracılığıyla mannequin, dahili takım ve CI/CD sistemlerine gömülebilir. Bu, özellikle kullanıcının AI modelinin dışarı çıkmasını ve özerk bir şekilde yapmasını, sadece bittiğinde veya sorular ortaya çıktığında kontrol etmesini istediği bir veya birden fazla görevi tetiklediği, yani, özellikle de uygun hale getirir.
  • Veri ikamet ve maliyet kontrolü: Açık bir mannequin olarak, İşletmeler Qwen3-Coder’ı kendi altyapısına (bulut anısına ister şirket içi) dağıtabilir, satıcı kilitlenmesini ve hesaplama kullanımını daha doğrudan yönetebilir

Çeşitli geliştirici ortamlarda uzun bağlamlar ve modüler dağıtım seçenekleri için destek, Qwen3 kodlayı hem büyük teknoloji şirketlerinde hem de daha küçük mühendislik ekiplerinde üretim sınıfı AI boru hatları için bir aday haline getirir.

Geliştirici erişimi ve en iyi uygulamalar

Qwen3-Coder’ı en uygun şekilde kullanmak için Qwen şunları önerir:

  • Örnekleme Ayarları: Sıcaklık = 0.7, Top_p = 0.8, Top_k = 20, Repetition_Penalty = 1.05
  • Çıktı uzunluğu: 65.536 jetona kadar
  • Transformers sürümü: 4.51.0 veya üstü (eski sürümler Qwen3_MOE uyumsuzluğu nedeniyle hatalar atabilir)

API’ler ve SDK örnekleri Openai uyumlu Python istemcileri kullanılarak sağlanır.

Geliştiriciler özel araçları tanımlayabilir ve Qwen3-koderin konuşma veya kod oluşturma görevleri sırasında onları dinamik olarak çağırmasına izin verebilir.

AI Energy kullanıcılarından sıcak erken resepsiyon

QWEN3-Coder-480B-A35b-in-in-in-insruct’a yapılan ilk yanıtlar, modeli gerçek dünya kodlama iş akışlarında check eden AI araştırmacıları, mühendisler ve geliştiriciler arasında önemli ölçüde olumlu olmuştur.

Raschka’nın yukarıdaki yüce övgüsüne ek olarak, Ellamindai’de bir AI mühendisi ve değerlendiricisi Wolfram Ravenwolf, deneyimini paylaştı Modeli Claude koduyla entegre etmekbelirtiyor, “Bu kesinlikle şu anda en iyisi.”

Birkaç entegrasyon vekilini check ettikten sonra Ravenwolf, nihayetinde optimum performansı sağlamak için Litellm’i kullanarak kendisini inşa ettiğini ve modelin araç zinciri özelleştirmesine odaklanan uygulamalı uygulayıcılara cazibesini gösterdiğini söyledi.

Eğitimci ve AI Tinkerer Kevin Nelson da X üzerinde ağırlık verdi Simülasyon görevleri için modeli kullandıktan sonra.

“Qwen 3 kodlayıcı başka bir seviyede,” Modelin sadece yürütülen iskele sağladığını değil, aynı zamanda simülasyonun çıktısına bir mesaj yerleştirdiğini belirtti – modelin görev bağlamı bilincinin beklenmedik ama hoş bir işareti.

Twitter kurucu ortağı ve kare (şimdi “blok” olarak adlandırılır) kurucusu Jack Dorsey, modelin övgüsünde bir X mesajı yayınladı. yazma: “Goose + Qwen3-Coder = WOW,“VentureBeat’in Ocak 2025’te ele geçirdiği açık kaynaklı AI Ajan Çerçeve Goose’a referans olarak.

Bu yanıtlar, QWEN3-Coder’ın performans, uyarlanabilirlik ve mevcut geliştirme yığınlarıyla daha derin entegrasyon arayan teknik olarak anlayışlı bir kullanıcı tabanı ile yankılandığını göstermektedir.

İleriye Bakış: Daha fazla Boyut, Daha Fazla Kullanım Örneği

Bu sürüm en güçlü varyant olan Qwen3-Coder-480B-A35b-in-in-in-in-insruct’a odaklanırken, Qwen ekibi ek mannequin boyutlarının geliştirildiğini göstermektedir.

Bunlar, daha düşük dağıtım maliyetleriyle benzer özellikler sunmayı ve erişilebilirliği genişletmeyi amaçlayacaktır.

Gelecekteki çalışmalar, ekibin ajan modellerinin gerçek dünya kullanımıyla kendi performanslarını yinelemeli olarak geliştirip rafine edip edemeyeceğini araştırdığı için kendini geliştirmeyi keşfetmeyi de içerir.


avots