當(dāng)好萊塢還在為預(yù)算頭疼時(shí),硅谷的AI、韓國(guó)的IP和中東的資本已經(jīng)悄然聯(lián)手,他們的目標(biāo)是用一個(gè)全新的「導(dǎo)演級(jí)AI」物種,徹底重塑電影工業(yè)。
AI原生影視工作室Utopai Studios與全球創(chuàng)新投資平臺(tái)Stock Farm Road(SFR)共同宣布,成立資本規(guī)模達(dá)數(shù)十億美元的合資企業(yè)Utopai East。

SFR由LG集團(tuán)繼承人Brian Koo、阿聯(lián)酋主權(quán)基金推動(dòng)者Amin Badr-El-Din聯(lián)合創(chuàng)立。
該合作旨在將AI影視生成技術(shù)從實(shí)驗(yàn)階段推向大規(guī)模產(chǎn)業(yè)化,并押注正處在爆發(fā)期的全球韓流內(nèi)容市場(chǎng),以「AI原生工作流+韓娛+全球市場(chǎng)通道」的組合拳,為下一代視聽(tīng)內(nèi)容生產(chǎn)提供全新范式。


黃金機(jī)遇
韓娛100倍的全球增長(zhǎng)
在傳統(tǒng)好萊塢電影產(chǎn)業(yè)深陷「高成本、低回報(bào)」的結(jié)構(gòu)性困境之時(shí),韓國(guó)流行文化正展現(xiàn)出驚人的全球吸引力與商業(yè)潛力。
根據(jù)最新行業(yè)數(shù)據(jù),韓娛內(nèi)容全球觀(guān)看時(shí)長(zhǎng)占比在短短五年內(nèi)從22%迅猛提升至35%,Netflix平臺(tái)上的《僵尸校園》《黑暗榮耀》等劇集連創(chuàng)觀(guān)看時(shí)長(zhǎng)新紀(jì)錄,凸顯了其穩(wěn)固的受眾基本盤(pán)。

更令人矚目的是,融合了K-POP、奇幻敘事與頂級(jí)視效的創(chuàng)新IP《K-POP Demon Hunter》,在全球Z世代觀(guān)眾中引發(fā)了現(xiàn)象級(jí)熱潮。
該IP首季全球流媒體播放量即突破12億次,相關(guān)音樂(lè)榜單霸榜超過(guò)20周,衍生周邊商品收入高達(dá)數(shù)億美元,充分證明了優(yōu)質(zhì)韓流內(nèi)容具備強(qiáng)大的跨文化穿透力和多元變現(xiàn)能力。

伴隨著韓流內(nèi)容全球市場(chǎng)需求激增,Utopai Studios創(chuàng)始人兼CEO Cecilia Shen和LG集團(tuán)現(xiàn)任會(huì)長(zhǎng)Brain Koo在采訪(fǎng)中都認(rèn)為,韓娛起碼還有100倍的全球增長(zhǎng)。
Utopai與SFR的聯(lián)手,正是瞄準(zhǔn)了這一機(jī)會(huì)。
SFR在韓國(guó)規(guī)劃的350億美元AI數(shù)據(jù)中心樞紐,將為Utopai的先進(jìn)AI影視模型提供強(qiáng)大的算力底座,共同將高質(zhì)量、電影級(jí)長(zhǎng)片內(nèi)容的生成從技術(shù)驗(yàn)證推向規(guī)模化、經(jīng)濟(jì)化的產(chǎn)業(yè)應(yīng)用。

新公司Utopai East的治理結(jié)構(gòu)也體現(xiàn)了深度整合,由LG北美創(chuàng)新中心高管Kevin Chong和CJ集團(tuán)前國(guó)際化負(fù)責(zé)人Richard Lee領(lǐng)導(dǎo),能夠有效融合科技與文創(chuàng)資源。
同時(shí),Cecilia將出任SFR戰(zhàn)略顧問(wèn)委員會(huì)首席創(chuàng)始成員,與Alphabet董事長(zhǎng)John Hennessy等領(lǐng)袖共同制定AI影視倫理標(biāo)準(zhǔn)。
這一布局確保了技術(shù)、資本(特別是連接硅谷與中東的資本網(wǎng)絡(luò))與全球市場(chǎng)渠道的深度融合,目標(biāo)是打造一個(gè)新型創(chuàng)作基礎(chǔ)設(shè)施,助推韓國(guó)內(nèi)容以好萊塢級(jí)制作標(biāo)準(zhǔn)高效對(duì)接全球市場(chǎng),從而支持更多像《K-POP Demon Hunter》一樣的頂級(jí)韓流IP,以更高效率和更可控的成本實(shí)現(xiàn)全球化制作與發(fā)行。


技術(shù)架構(gòu)
「導(dǎo)演級(jí)AI」如何統(tǒng)籌全局
面對(duì)韓流內(nèi)容日益增長(zhǎng)的全球需求與敘事復(fù)雜度的不斷提升,UtopaiAI模型的創(chuàng)新之處在于——
跳出了當(dāng)前AI視頻領(lǐng)域「Diffusion vs. AR」的模型之爭(zhēng),構(gòu)建了一個(gè)以敘事為中心、具備因果規(guī)劃能力的「導(dǎo)演級(jí)AI」系統(tǒng)架構(gòu)。
Utopai的解決方案基于一個(gè)獨(dú)特的洞察:傳統(tǒng)AI視頻技術(shù)的問(wèn)題在于,它們是「畫(huà)師」而非「導(dǎo)演」。
目前主流的Diffusion模型在專(zhuān)業(yè)影視制作中存在天然短板。
它本質(zhì)上是「概率性生成模型」,擅長(zhǎng)從噪音中「雕刻」出單幀高質(zhì)量畫(huà)面,但其逐幀或短片段獨(dú)立生成的模式,缺乏對(duì)長(zhǎng)敘事邏輯的全局規(guī)劃能力。
這導(dǎo)致生成的視頻難以保證人物外貌、動(dòng)作和場(chǎng)景元素在不同鏡頭中的一致性。

Utopai的破解之道是構(gòu)建一個(gè)「理解—生成」一體化的統(tǒng)一架構(gòu),采用前幀預(yù)測(cè)后幀的機(jī)制,其中「導(dǎo)演級(jí)AI」(采用自回歸全能模型)扮演「總規(guī)劃師」的角色。
該架構(gòu)的核心是創(chuàng)建一個(gè)統(tǒng)一的狀態(tài)空間,用于承載敘事、幾何與運(yùn)動(dòng)約束。
· 規(guī)劃器在此空間內(nèi)對(duì)未來(lái)時(shí)空進(jìn)行可預(yù)測(cè)的演化推演,并確保與歷史觀(guān)測(cè)高度一致;
· 渲染器則依據(jù)此規(guī)劃生成最終畫(huà)面,從而在長(zhǎng)片段上實(shí)現(xiàn)可控的敘事一致性與高保真畫(huà)質(zhì)。

Utopai的架構(gòu)精髓則在于規(guī)劃與渲染的解耦。
上層的序列規(guī)劃器(世界模型)充當(dāng)系統(tǒng)的「導(dǎo)演大腦」,其核心任務(wù)是敘事規(guī)劃與一致性約束。
它以腳本和分鏡為輸入,生成包含角色I(xiàn)D向量、關(guān)鍵幀布局、相機(jī)位置與運(yùn)動(dòng)軌跡、場(chǎng)景約束以及情緒走向曲線(xiàn)等細(xì)節(jié)的shot級(jí)時(shí)空計(jì)劃。
更重要的是,規(guī)劃器能維護(hù)一個(gè)可回放的長(zhǎng)程狀態(tài)記憶,確保在超長(zhǎng)時(shí)程的敘事中,角色身份、場(chǎng)景狀態(tài)和光影變化能夠穩(wěn)定演進(jìn),進(jìn)而從根本上解決跨鏡頭元素「漂移」的難題。

在確定敘事藍(lán)圖后,專(zhuān)業(yè)化的生成模塊(包含優(yōu)化的Diffusion技術(shù))下層的條件渲染器(時(shí)空擴(kuò)散)則專(zhuān)注于執(zhí)行高質(zhì)量的畫(huà)面生成。
它在潛空間進(jìn)行操作,生成條件包括深度、法線(xiàn)、光流、遮罩、參考幀、相機(jī)軌跡等豐富的結(jié)構(gòu)化信號(hào)。
這種分工使得規(guī)劃器可以專(zhuān)注于長(zhǎng)序列的因果結(jié)構(gòu)與約束傳播,充當(dāng)「導(dǎo)演」角色;而渲染器(經(jīng)過(guò)優(yōu)化的Diffusion技術(shù))則作為頂尖的「執(zhí)行團(tuán)隊(duì)」,發(fā)揮其在畫(huà)面細(xì)節(jié)與動(dòng)態(tài)質(zhì)感上的優(yōu)勢(shì)。
二者通過(guò)統(tǒng)一的狀態(tài)接口緊密耦合,形成一個(gè)高效的閉環(huán)系統(tǒng)。

理解世界
獨(dú)特的訓(xùn)練方法論
Utopai模型能力的飛躍源于其獨(dú)特的訓(xùn)練方法論,核心是讓AI從大量高質(zhì)量、帶精確標(biāo)注的3D合成數(shù)據(jù)中學(xué)習(xí)。
與主要依賴(lài)網(wǎng)絡(luò)二維視頻進(jìn)行訓(xùn)練的通用模型不同,這種方法使AI模型能夠內(nèi)化物理規(guī)律,從根本上理解空間、遮擋和碰撞等三維世界規(guī)則,有效避免生成內(nèi)容違背物理規(guī)律的「幻覺(jué)」問(wèn)題。
訓(xùn)練過(guò)程分為兩個(gè)關(guān)鍵階段:
1. 幾何與語(yǔ)義對(duì)齊預(yù)訓(xùn)練:此階段目標(biāo)是建立模型對(duì)物理世界和視覺(jué)元素的底層理解,進(jìn)行文本-視頻-幾何對(duì)齊以及下一狀態(tài)/掩碼重建等任務(wù)。
2. 多模態(tài)指令微調(diào):此階段增強(qiáng)模型對(duì)復(fù)雜、抽象的敘事指令和跨模態(tài)約束的遵循能力,使其能精準(zhǔn)理解并實(shí)現(xiàn)導(dǎo)演的創(chuàng)作意圖。
這種訓(xùn)練方式使模型能夠?qū)?fù)雜的情感和敘事意圖進(jìn)行狀態(tài)級(jí)的精確建模與可視化表達(dá)。

例如,當(dāng)指令要求表現(xiàn)角色「從懷疑轉(zhuǎn)變?yōu)榛腥淮笪颉箷r(shí),模型能夠協(xié)調(diào)身體姿態(tài)、視線(xiàn)方向、鏡頭語(yǔ)言以及光影變化等一系列要素,呈現(xiàn)一個(gè)在表演邏輯上合理、情感層次分明的完整轉(zhuǎn)變過(guò)程,而非簡(jiǎn)單地替換一個(gè)表情貼圖。

共生進(jìn)化
AI與影視創(chuàng)作的關(guān)系
Utopai技術(shù)路徑的精妙之處在于并非簡(jiǎn)單地用AR模型替代Diffusion模型,而是形成一種規(guī)劃與執(zhí)行分離的協(xié)同范式。
通過(guò)構(gòu)建深度理解敘事邏輯與物理規(guī)則的智能系統(tǒng),Utopai的影視模型實(shí)現(xiàn)了人與AI的共生進(jìn)化。

其「規(guī)劃—渲染」的協(xié)同范式將長(zhǎng)程一致性與敘事可控性轉(zhuǎn)化為可計(jì)算、可優(yōu)化的狀態(tài)規(guī)劃問(wèn)題,為專(zhuān)業(yè)影視制作者提供了兼具創(chuàng)造性自由度與工業(yè)化可控性的全新解決方案。
隨著AI技術(shù)有望擊穿傳統(tǒng)制作的成本與效率壁壘,電影與高端視聽(tīng)內(nèi)容的未來(lái),正從「預(yù)算的暴政」轉(zhuǎn)向「想象力的自由」。
對(duì)于正值黃金時(shí)代的韓流內(nèi)容產(chǎn)業(yè)而言,Utopai帶來(lái)的不僅僅是一項(xiàng)降本增效的工具,更是一臺(tái)推動(dòng)其創(chuàng)意潛能無(wú)限釋放、邁向全球主流市場(chǎng)的強(qiáng)大引擎。
那些曾因制作成本與周期限制而被擱置的宏大創(chuàng)意,特別是融合了K-POP、webtoon等獨(dú)特文化基因的創(chuàng)新IP,正迎來(lái)被全球觀(guān)眾看見(jiàn)的曙光。