多模態(tài)視頻生成模型通義萬相Wan2.2-S2V正式發(fā)布
- 來源:快科技
- 作者:隨心
- 編輯:一只小編輯OVO
昨晚,阿里云正式發(fā)布全新多模態(tài)視頻生成模型通義萬相Wan2.2-S2V,并宣布開源。
Wan2.2-S2V極大地簡(jiǎn)化了視頻制作過程,僅需提供一張靜態(tài)圖片和一段音頻,模型便能生成面部表情自然、口型與音頻高度一致、肢體動(dòng)作流暢絲滑的電影級(jí)數(shù)字人視頻。
支持分鐘級(jí)長(zhǎng)視頻穩(wěn)定生成,不止嘴動(dòng),手勢(shì)、表情、姿態(tài)都能動(dòng)。
而且模型在訓(xùn)練中充分挖掘跨域泛化能力,可自然驅(qū)動(dòng)卡通人物、動(dòng)物形象、二次元角色、藝術(shù)風(fēng)格化人像,不再局限于真人肖像。
無論是萌寵說話,還是動(dòng)漫角色唱歌,Wan2.2-S2V都能精準(zhǔn)還原音畫同步效果。
其提供480P與720P兩檔分辨率,兼顧效率與畫質(zhì),適用于短視頻、數(shù)字人、輕量影視等場(chǎng)景。

玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論