一款化名「HappyHorse-1.0」(歡樂馬)的AI視頻生成模型,近日在權威評測榜單中異軍突起,超越字節跳動、Google等巨頭同類產品,引發科技圈關注。內地傳媒《界面新聞》確認,模型是阿里巴巴(09988.HK)ATH(Alibaba Token Hub)旗下創新事業部的研發成果,目前正處內測,並將於近期開放API。

HappyHorse模型在評測平台Artificial Analysis的Video Arena榜的盲測中,表現亮麗,在文生視頻(無音頻)方面,得分1383分,領先第2名—字節跳動Seedance 2.0約110分。在圖生視頻(無音頻)方面,得分1413分,刷新歷史最高紀錄。在含音頻生成賽道,綜合表現亦和Seedance 2.0旗鼓相當。

根據評分體系,超過60分的差距被視為穩定優勢。今次HappyHorse領先第2名的幅度超過100分,被業界形容為「斷層式」領先,而第2至第10名的總分差,都不及它與第2名的差距。

長板突出:場景真實感與「成片感」

國聯民生證券計算機團隊的實測研報,「歡樂馬」最突出的優勢在於生成的視頻,具有極強的場景感、真實感與「成片感」。報告指出,模型在環境豐富度、空間層次、材質紋理及鏡頭畫面的「飽滿感」方面,完成度很高,尤其適合用於廣告片素材、社交媒體短視頻等,需要強烈氛圍感的內容創作。

不過,報告同時指出模型的明顯短板:當涉及複雜時序動作時,模型會暴露出底層控制力不足的問題,出現動作理解不到位、肢體關係錯亂、連貫性下降等缺陷。測評認為,「歡樂馬」目前更像一位「很會拍漂亮鏡頭的攝影師」,但還不是一位能精準調度複雜動作的「成熟導演」。

阿里巴巴ATH方面表示,HappyHorse是創新事業部「AI時代全新交互方式探索計劃」的一部分,後續將有更多產品陸續推出。模型已註冊官方微博,將在不久後正式推出。