AI原生影視工作室 Utopai Studios 宣布推出專為電影與電視制作而設(shè)計(jì)的合規(guī)AI模型和工作流。與目前主流的創(chuàng)新通用視頻模型不同,Utopai的并重AI模型并非為了生成短視頻或視覺(jué)效果,而是影視專為影視創(chuàng)作而生,具備“理解劇本、模型解析故事,落地倫理并協(xié)助導(dǎo)演規(guī)劃鏡頭和生成場(chǎng)景”的僅用能力。將這些環(huán)節(jié)整合為一體后,授權(quán)素材系統(tǒng)可以強(qiáng)化故事結(jié)構(gòu)、筑牢表演呈現(xiàn)與鏡頭連貫性——這些都是行業(yè)專業(yè)影視制作的關(guān)鍵能力。
(Utopai自制電影《科爾特斯》畫(huà)面)
當(dāng)前影視行業(yè)普遍面臨高成本、底線低效率的合規(guī)挑戰(zhàn)——頭部影片從立項(xiàng)到上映往往需要 3 至 5 年,而現(xiàn)有 AI 工具大多僅能承擔(dān)素材生成或后期增強(qiáng)等碎片化環(huán)節(jié),創(chuàng)新主流的并重AI視頻生成模型(如Diffusion)在專業(yè)影視制作中存在天然短板。
Diffusion模型本質(zhì)上是影視“概率性生成模型”,它們逐幀或短片段獨(dú)立生成視頻,缺乏對(duì)長(zhǎng)敘事邏輯的全局規(guī)劃能力。這導(dǎo)致生成的視頻難以保證人物外貌、動(dòng)作和場(chǎng)景元素在不同鏡頭中的一致性。
Utopai的破解之道是不再追求單一模型的極致優(yōu)化,而是通過(guò)架構(gòu)重組,讓不同模型各司其職。其中自回歸模型(AR)負(fù)責(zé)“規(guī)劃”,擴(kuò)散模型(Diffusion)負(fù)責(zé)“渲染”,最后通過(guò)統(tǒng)一狀態(tài)空間耦合。
其中,上層的序列規(guī)劃器(世界模型)充當(dāng)系統(tǒng)的“導(dǎo)演大腦”,其核心任務(wù)是敘事規(guī)劃與一致性約束。它以腳本和分鏡為輸入,生成包含角色I(xiàn)D向量、關(guān)鍵幀布局、相機(jī)位置與運(yùn)動(dòng)軌跡、場(chǎng)景約束以及情緒走向曲線等細(xì)節(jié)的shot級(jí)時(shí)空計(jì)劃。
更重要的是,規(guī)劃器能維護(hù)一個(gè)可回放的長(zhǎng)程狀態(tài)記憶,確保在超長(zhǎng)時(shí)程的敘事中,角色身份、場(chǎng)景狀態(tài)和光影變化能夠穩(wěn)定演進(jìn),進(jìn)而從根本上解決跨鏡頭元素“漂移”的難題。
在確定敘事藍(lán)圖后,專業(yè)化的生成模塊(包含優(yōu)化的Diffusion技術(shù))下層的條件渲染器(時(shí)空擴(kuò)散)則專注于執(zhí)行高質(zhì)量的畫(huà)面生成。它在潛空間進(jìn)行操作,生成條件包括深度、法線、光流、遮罩、參考幀、相機(jī)軌跡等豐富的結(jié)構(gòu)化信號(hào)。
二者通過(guò)統(tǒng)一的狀態(tài)接口緊密耦合,形成一個(gè)高效的閉環(huán)系統(tǒng)。
目前,該工作流暫不對(duì)外商用,僅用于公司自有影視項(xiàng)目,服務(wù)于公司即將推出的影視劇集與影視領(lǐng)域的合作伙伴,以確保模型應(yīng)用在道德,授權(quán)、可控的專業(yè)制作場(chǎng)景中。
通過(guò)保持工作流的自有性,Utopai希望能證明AI完全能夠?yàn)橛耙曋谱魈峁I(yè)支持。在推進(jìn)故事創(chuàng)作、優(yōu)化制作流程與提升影視作品的同時(shí),協(xié)助導(dǎo)演、編劇及制作團(tuán)隊(duì)更快、更好地完成創(chuàng)作。
“大多數(shù)AI視頻模型的目標(biāo)是讓畫(huà)面更驚艷,而我們的目標(biāo)是讓電影品質(zhì)更高”Utopai Studios 創(chuàng)始人兼CEO Cecilia Shen表示,“影視行業(yè)不需要多一個(gè)生成視頻片段的工具,而是需要一個(gè)能夠理解劇本、鏡頭和故事意圖的模型。這正是我們推出該模型的初衷。更重要的是,我們希望技術(shù)尊重創(chuàng)作者,通過(guò)確保模型訓(xùn)練過(guò)程符合道德和行業(yè)標(biāo)準(zhǔn),讓AI成為協(xié)作者,而非替代者。”
在現(xiàn)有工作流的基礎(chǔ)上,Utopai 正在研發(fā)下一代具備推理能力的統(tǒng)一生成模型。這一技術(shù)路線的核心,是開(kāi)發(fā)一種自回歸式多模態(tài)生成模型(auto-regressive omni model),能夠精準(zhǔn)掌握從劇本理解到電影呈現(xiàn)的完整生成流程。
這一技術(shù)將成為 “從劇本到銀幕” 的高質(zhì)量、工業(yè)級(jí)智能化制作的核心基礎(chǔ)。
由于該工作流專為影視制作設(shè)計(jì),模型僅使用經(jīng)授權(quán)、與電影內(nèi)容高度相關(guān)的數(shù)據(jù)集進(jìn)行訓(xùn)練,確保學(xué)習(xí)來(lái)源于專業(yè)且合規(guī)的素材,而非未經(jīng)篩選的互聯(lián)網(wǎng)數(shù)據(jù)。
工作流在美國(guó)、歐洲和亞洲均采用本地化部署,以符合各地區(qū)的 AI 與數(shù)據(jù)監(jiān)管要求,確保使用透明、治理合規(guī)。
通過(guò)在訓(xùn)練與部署中全面遵循影視行業(yè)標(biāo)準(zhǔn),Utopai 讓 AI 學(xué)習(xí)過(guò)程符合現(xiàn)有的版權(quán)與行業(yè)倫理規(guī)范,也確保 AI 在影視制作中實(shí)現(xiàn)負(fù)責(zé)任的應(yīng)用。
Utopai 的核心技術(shù)團(tuán)隊(duì)具備深厚的科研背景與行業(yè)經(jīng)驗(yàn)。聯(lián)合創(chuàng)始人兼首席技術(shù)官 Jie Yang 曾任 Alphabet 旗下公司 Mineral 的研究主管,主導(dǎo)多模態(tài)人工智能研究。在此之前,他長(zhǎng)期任職于 Google Research。目前,Utopai 也在持續(xù)擴(kuò)充團(tuán)隊(duì),吸引來(lái)自 Google 及其他頂尖 AI 機(jī)構(gòu)的人才,推動(dòng)人工智能與電影藝術(shù)的深度融合。
Utopai 的專有工作流將率先應(yīng)用于公司自制的影視項(xiàng)目,并已在其公布的片單中啟用。通過(guò)將這項(xiàng)技術(shù)直接融入自有制作流程,Utopai 正在展示 AI 如何以負(fù)責(zé)任的方式賦能影視創(chuàng)作者——從前期策劃到最終交付,全程提升影視創(chuàng)作的效率與表現(xiàn)力。
關(guān)于Utopai Studios
Utopai Studios是一家AI原生影視公司,專注以AI賦能影視創(chuàng)作。其自己訓(xùn)練的模型和工作流幫助導(dǎo)演與編劇以更高效率、更低成本實(shí)現(xiàn)高質(zhì)量作品。公司前身為 3D 世界與視頻生成技術(shù)創(chuàng)新者Cybever,后重組并更名為 Utopai Studios。Utopai 結(jié)合自主研發(fā)的制作技術(shù)與國(guó)際一流創(chuàng)意團(tuán)隊(duì),開(kāi)發(fā)并出品具有電影級(jí)品質(zhì)的影視作品。Utopai的愿景是讓AI成為影視創(chuàng)作的伙伴,而非替代者,推動(dòng)全球影視行業(yè)邁向智能化與創(chuàng)意共生的新階段。


相關(guān)文章




精彩導(dǎo)讀
熱門(mén)資訊
關(guān)注我們