全球首個統一多模態視頻大模型!可靈AI O1正式上線:一句話生成視頻
0
12月2日消息,全球可靈AI正式全量上線其全新O1視頻大模型,首個視頻上線生成視頻號稱“全球首個統一多模態視頻大模型”,統多打破傳統視頻生成工具功能割裂、模態操作復雜的大模痛點。
目前,正式該模型已在可靈App及官網開放體驗。句話
與以往需分步處理文生視頻、全球圖生視頻、首個視頻上線生成視頻局部編輯等任務不同,統多可靈O1基于創新MVL(多模態視覺語言)交互架構,模態在單一輸入框內無縫融合文字、大模圖像、正式視頻等多種指令。句話
結合Chain-of-thought技術,全球模型不僅能理解用戶意圖,還能進行常識推理與事件推演,實現更符合邏輯的視頻生成。
例如,用戶上傳一段真人視頻后,只需簡單對話指令,即可局部增加/刪除元素、智能延展前后鏡頭、捕捉動作生成新畫面。
更關鍵的是,O1通過多視角主體構建技術,徹底解決視頻中人物或物體在鏡頭切換時“特征漂移”的行業難題,確保多主體場景下畫面精準連貫。
此外,O1支持3–10秒自由生成時長,把敘事節奏的控制權交還創作者。
無論是短視頻博主、廣告團隊還是個人用戶,都能快速產出高質量、高一致性的創意視頻。