AI視頻生成模型近期引起關注,快手和字節分別發布可靈3.0和Seedance 2.0,東吳證券指,相較上一代模型,兩個新模型在多方面都有突破,但最大的突破是實現視頻輸入,只酚上傳一個視頻,模型可以根據視頻中的內容做參考,生成新視頻,補齊原生多模態的拼圖。

東吳證券又就兩個新模型,進行7組測試,覆蓋動畫風格和真人寫實風格)。東吳證券認為,Seedance更側重於幫用戶表達故事,可靈則更側重專業級別的內容生產。可靈的電影質感更強,包括打光、精細表情、皮膚細節、奔跑時的動作控制,以及背景雨水等細節都更豐富。生成一個5秒鐘720P視頻,可靈約4元人民幣,Seedance約2.3元人民幣,Seedance的定價優勢更明顯。

東吳又用同一提示詞「男子雨中奔跑」測試多家視頻模型。結論是目前可靈3.0和Seedance 2.0處於全球最強水平。阿里的萬相2.6比較卡通風格,缺乏細節。MiniMax的海螺2.3視頻生成比較真實,但缺點是無法實現音畫同出,需要後期配音。Google的Veo 3.1具備基本要素,但人物看起來有點奇怪。OpenAI的Sora 2效果比較差,有很明顯的遊戲感,可能是因為訓練時喂入較多的遊戲引擎數據。

從定價看,國內幾家5秒鐘視頻定價大約在0.4美金左右,海外模型方面,Google5秒視頻需要約5美元,OpenAI的Sora 2約2.5美元。

報告指,目前幾家主要AI視頻模型的ARR(年化經常性收入)都快速增長,出現1年增長1至3倍的趨勢,而且無出現A公司增長導致B公司收入下降的情況。截至今年1月份,主要公司的ARR加起來大約不到10億美金,仍是一個非常早期的藍海市場。相比之下,OpenAI已有200億美元ARR,Anthropic有90億美元ARR,兩家加起來接近300億美元。

下遊市場方面,報告指,國內電影票房每年約400億至600億元人民幣,海外約100億至200億美元。再考慮到社交短視頻、廣告片、真人短劇等,顯示目前AI視頻行業的滲透率仍然很低。

至於中美差距方面,東吳指,文本模型差距約3到6個月,但在視頻方面,國內已超過了Veo 3.1和Sora 2,階段性來看,視頻AI領域中美差距很小,甚至中國實現了反超。核心原因在於國內擁有較多的多模態數據—字節和快手各自擁有自己視頻平台的數據,而Google有youtube和waymo的數據。

而第三方機構Mayor Research估計,中國視頻製作市場約200多億美元,全球約1600多億美元,涵蓋長視頻、短視頻、中視頻以及漫畫和真人等各種風格。目前AI能滲透的部分主要是漫劇和一部分廣告片、KTV背景視頻等。從用戶規模看,漫劇觸及的用戶約1億多,微短劇接近7億用戶,長視頻、短視頻及網絡視頻則是8億到10億用戶。AI目前觸及的用戶體量仍較小。