Ana Sayfa Teknoloji Baidu’nun Musestreamer AI video üretim modeli, yerel ses desteğiyle Google’ın Veo 3’ü...

Baidu’nun Musestreamer AI video üretim modeli, yerel ses desteğiyle Google’ın Veo 3’ü alıyor: Rapor

12
0

Baidu’nun Çarşamba günü yeni bir yapay zeka (AI) video üretim modeli yayınladığı bildirildi. Rapora göre, Musestreamer AI modeli, Çin sesini oluşturulan videolara entegre edebilir, bu da onu Google’ın Veo 3’ten sonra ikinci bir mannequin haline getirebilir. Teknoloji devi, dünyanın yerli Çin ses üretimi desteğine sahip ilk AI modeli olduğunu iddia ediyor. Büyük Dil Modelinin (LLM) tanıtımının yanı sıra, şirketin Huixiang adlı yeni bir video içeriği oluşturma platformu başlattığı bildirildi. Özellikle, ne musestreamer ne de Huixiang şu anda Çin dışında mevcut değil.

Baidu’nun musestreamer’ın Çince ses üretebileceği bildiriliyor

AI video üretim modeli dünyası son iki yılda önemli ölçüde gelişti. Sabit sayıda parmakla insanları üretmek için mücadele eden modellerden LLM’lere taşındık, bu da artık gerçekçi fizik ve hareketi doğru bir şekilde tasvir edebiliyor. Bununla birlikte, çoğu AI oyuncusunun giriş yapmaktan kaçındığı bir alan, sesli olarak da destekleyen videolardı.

Google I/O 2025’te teknoloji devi, bu yeteneği hemen kasabadan konuşan ve en büyük rakibi Openai’nin Sora’sını bırakan VEO 3 ile sunan ilk şirket oldu. Mountain View tabanlı teknoloji devi, Gemini uygulamasının mevcut olduğu 154 ülkede VEO 3’ü genişletti ve şirketin bu araç için agresif itişini vurguladı.

Ancak, Asya’daki bir teknolojiye göre rapor (aracılığıyla AI Base), Çin teknoloji devi Baidu da Musestream AI modeli ile yarışa girdi. Çin sesli videolar ve bunu yapma özelliğine sahip tek mannequin oluşturduğu söyleniyor. Özellikle, Veo 3 yalnızca İngilizce dilinde ses üretebilir.

Musestreamer’ın yalnızca videolarla senkronize edilmiş diyaloglar oluşturmakla kalmayıp, aynı zamanda videolara ses efektleri ve ortam sesleri de ekleyebileceği bildiriliyor. Baidu’nun, modelin VBENCH I2V ölçütünde yüzde 89,38 puan aldığını iddia ettiği söyleniyor. Teknoloji devi LLM’yi tüketiciler için bir içerik oluşturma aracı olarak kullanıyor.

AI modelinin yanı sıra Baidu’nun Huixiang adlı yeni bir video içerik platformu başlattığı bildirildi. Huixiangg’ın kullanıcıların istemleri paylaşabileceği ve video oluşturabilecekleri AI modeli için ön uç olarak hizmet ettiği söyleniyor. Raporda, platform şu anda 1080p çözünürlükte 10 saniyelik video nesilleri destekliyor. Buna karşılık, VEO 3 sadece sekiz saniyelik videolar oluşturabilir. Videonun varsayılan en boy oranı üzerinde netlik yoktur ve kullanıcılar farklı en boy oranlarında videolar oluşturabilirler.

avots