Alibaba’nın Qwen ekibi geçen hafta yeni bir Picture Nesil Yapay Zeka (AI) modeli yayınladı. Qwen VLO olarak adlandırılan, Qwen 2.5 Vizyon Dili modelinin halefidir ve eski modellere kıyasla birkaç yükseltme ile birlikte gelir. En son AI görüntü modeli, hem imajdan hem de görüntüden imajdan üretimi destekler. Ayrıca İngilizce ve Çince dahil olmak üzere birçok dilde metin girdisini destekler. Görüntü üretiminin yanı sıra, AI modeli de oluşturulan görüntülere ve giriş görüntülerine satır içi düzenlemeler yapabilir.
Qwen VLO, birden çok dilde istemleri kabul ediyor
Bir postalamak X’te (eski adıyla Twitter olarak bilinir), Qwen ekibinin resmi kullanımı yeni modelin piyasaya sürüldüğünü duyurdu. Modelin teknik adı QWEN3-235B-A22B’dir ve şirketin sohbet arayüzünde ücretsiz olarak mevcuttur. Kullanıcılar modeli giriş yapmadan da kullanabilir.
Devices 360 personeli AI modelini check etti ve görüntü oluşturma özelliğini Google’ın Imagen 2 ile eşit olarak buldu. Aşağıdaki talimat ve görüntü çıkış kalitesi Imagen-3 ve Openai’nin GPT-4O-Powered görüntü oluşturma özelliğinden biraz daha düşüktür. Bununla birlikte, üretim süresi her ikisinden de daha hızlıdır ve onlardan daha yüksek bir oran sınırına sahiptir.
Github’da sayfaŞirket, Qwen VLO’nun, giriş görüntüsünün yapısal bütünlüğünü bozmadan daha iyi sıralı düzenlemeler yapmasını sağlayan gelişmiş görüntü anlayışıyla geldiğini söyledi. Bu aynı zamanda çıktının genel kalitesini de artırır. Mannequin ayrıca belirsiz ve açık uçlu istemleri daha iyi anlar ve kullanıcı beklentileri ile uyumlu görüntüler oluşturabilir.
Görüntü oluşturma ve düzenlemenin yanı sıra, Qwen VLO, kenar algılama, segmentasyon, tahmin eşleme ve daha fazlası gibi görüntü ek açıklama ile ilgili görevleri de gerçekleştirebilir. Şirket, modelin gelecekteki sürümünün birden fazla giriş görüntüsünü kabul edebileceğini ve bunları kullanıcı isteklerine göre birleştirebileceğini söyledi.
Metin oluşturma da en son AI görüntü üreticisi ile geliştirildi. Mannequin testlerimizde farklı yazı tiplerinde doğru metin oluşturabildik. Son olarak, Qwen VLO ayrıca 4: 1 ve 1: 3 gibi aşırı oranlar da dahil olmak üzere girdi olarak dinamik en boy oranlarına sahip görüntüleri de destekler. Şirket, yakında farklı yön oranlarında görüntüler oluşturmak için özelliği eklemeyi planlıyor.