国产一区高清|日韩精品一区人妻|曰夲AV一区二区|美日韩一区二区三区|国产喷水在线观看|狼友网站成人大全|欧美日韩制服中文视频在线|久草加勒比手机在线|婷婷色综合无码专区|japanese 精品视频在线观看

騰訊混元發(fā)布全新視頻生成模型

DoNews11月21日消息,騰訊混元大模型團隊宣布開源最新視頻生成模型 HunyuanVideo 1.5,這是一款基于 Diffusion Transformer(DiT)架構、參數(shù)為8.3B的輕量級視頻生成模型,支持生成5-10秒的高清視頻。

模型已經搶先在「元寶」上線,可通過兩種方式即可體驗:一是輸入文字描述(Prompt),直接實現(xiàn)“文生視頻”;二是上傳圖片配合Prompt,輕松將靜態(tài)圖片轉化為動態(tài)視頻。

HunyuanVideo 1.5模型能力全面,支持中英文輸入的文生視頻與圖生視頻。

其中,圖生視頻能力展現(xiàn)出圖像與視頻的高度一致性,生成的視頻在色調、光影、場景、主體和細節(jié)等方面都能與原圖較好匹配。

模型還具備強指令理解與遵循能力,能夠精準地實現(xiàn)多樣化場景,包括運鏡、流暢運動、真實的物理規(guī)律遵循、寫實人物和人物情緒表情等多種指令。

同時,HunyuanVideo 1.5支持寫實、動畫、積木等多種風格,并可在視頻中生成中英文文字,滿足多樣化內容創(chuàng)作需求。

在畫質方面,模型可原生生成480p和720p高清視頻,并可通過超分模型提升至1080p電影級畫質。 此前,視頻生成領域的開源SOTA旗艦模型至少有20B,需要超過50GB顯卡方可部署。

HunyuanVideo 1.5定位為“開源小鋼炮”,顯著降低了使用門檻可在14G顯存的消費級顯卡上流暢運行,真正讓每一位開發(fā)者和創(chuàng)作者都能“玩起來”。

HunyuanVideo1.5通過多層次的技術創(chuàng)新,實現(xiàn)了生成效果、性能與尺寸上的平衡。HunyuanVideo 1.5創(chuàng)新的SSTA稀疏注意力機制(全稱Selective and Sliding Tile Attention, 選擇性滑動分塊注意力)在保證高質量生成的同時顯著提升推理效率,配合多階段漸進式訓練策略,在運動連貫性、語義遵循等關鍵維度均達到商用水平。

目前模型已上傳至Hugging Face和Github社區(qū)。

騰訊混元發(fā)布全新視頻生成模型
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號-1