Ana Sayfa Teknoloji Baidu’nun Musestreamer AI video üretim modeli, yerel ses desteğiyle Google’ın Veo 3’ü...

Teknoloji

Baidu’nun Musestreamer AI video üretim modeli, yerel ses desteğiyle Google’ın Veo 3’ü alıyor: Rapor

Yazar

5 Temmuz 2025

Baidu’nun Çarşamba günü yeni bir yapay zeka (AI) video üretim modeli yayınladığı bildirildi. Rapora göre, Musestreamer AI modeli, Çin sesini oluşturulan videolara entegre edebilir, bu da onu Google’ın Veo 3’ten sonra ikinci bir mannequin haline getirebilir. Teknoloji devi, dünyanın yerli Çin ses üretimi desteğine sahip ilk AI modeli olduğunu iddia ediyor. Büyük Dil Modelinin (LLM) tanıtımının yanı sıra, şirketin Huixiang adlı yeni bir video içeriği oluşturma platformu başlattığı bildirildi. Özellikle, ne musestreamer ne de Huixiang şu anda Çin dışında mevcut değil.

Baidu’nun musestreamer’ın Çince ses üretebileceği bildiriliyor

AI video üretim modeli dünyası son iki yılda önemli ölçüde gelişti. Sabit sayıda parmakla insanları üretmek için mücadele eden modellerden LLM’lere taşındık, bu da artık gerçekçi fizik ve hareketi doğru bir şekilde tasvir edebiliyor. Bununla birlikte, çoğu AI oyuncusunun giriş yapmaktan kaçındığı bir alan, sesli olarak da destekleyen videolardı.

Google I/O 2025’te teknoloji devi, bu yeteneği hemen kasabadan konuşan ve en büyük rakibi Openai’nin Sora’sını bırakan VEO 3 ile sunan ilk şirket oldu. Mountain View tabanlı teknoloji devi, Gemini uygulamasının mevcut olduğu 154 ülkede VEO 3’ü genişletti ve şirketin bu araç için agresif itişini vurguladı.

Ancak, Asya’daki bir teknolojiye göre rapor (aracılığıyla AI Base), Çin teknoloji devi Baidu da Musestream AI modeli ile yarışa girdi. Çin sesli videolar ve bunu yapma özelliğine sahip tek mannequin oluşturduğu söyleniyor. Özellikle, Veo 3 yalnızca İngilizce dilinde ses üretebilir.

Musestreamer’ın yalnızca videolarla senkronize edilmiş diyaloglar oluşturmakla kalmayıp, aynı zamanda videolara ses efektleri ve ortam sesleri de ekleyebileceği bildiriliyor. Baidu’nun, modelin VBENCH I2V ölçütünde yüzde 89,38 puan aldığını iddia ettiği söyleniyor. Teknoloji devi LLM’yi tüketiciler için bir içerik oluşturma aracı olarak kullanıyor.

AI modelinin yanı sıra Baidu’nun Huixiang adlı yeni bir video içerik platformu başlattığı bildirildi. Huixiangg’ın kullanıcıların istemleri paylaşabileceği ve video oluşturabilecekleri AI modeli için ön uç olarak hizmet ettiği söyleniyor. Raporda, platform şu anda 1080p çözünürlükte 10 saniyelik video nesilleri destekliyor. Buna karşılık, VEO 3 sadece sekiz saniyelik videolar oluşturabilir. Videonun varsayılan en boy oranı üzerinde netlik yoktur ve kullanıcılar farklı en boy oranlarında videolar oluşturabilirler.

avots

Baidu’nun Musestreamer AI video üretim modeli, yerel ses desteğiyle Google’ın Veo 3’ü alıyor: Rapor

Baidu’nun musestreamer’ın Çince ses üretebileceği bildiriliyor

Son Gönderi

Prime Day’den hemen önce Amazon, kendi akıllı termostatını rekor düşük bir...

Endonezya yanardağı tekrar patladıktan sonra Bali’ye uçuşlar iptal edildi

Influencer Stefi Cohen Aile İçi Şiddet Bataryası nedeniyle Tutuklandı: Rapor

7/7 20. Yıldönümü: King Nation’ı Londra terör saldırılarının kurbanlarını hatırlamaya çağırıyor

PBA: Caelan Tiongson en son yarı çıkıştan sonra ‘tnt hastası’

Take a look at ettikten sonra, Wi-Fi olmadan ev güvenliği almanın...

Bu Süpermen memesi bir sürü komik hayran yorumuna ilham verdi ve...

Teksas sellerinde en az 81 ölü ve düzinelerce kayıp

Thunder G Ajay Mitchell çok yıllı bir anlaşma

‘Love Island ABD’nin Cierra Ortega’nın ebeveynleri, Backlash & Peacock Serisi çıkışının...