當地時間12月4日,OpenAI首席執行官山姆·奧特曼在社交媒體透露:“接下來的12個工作日中,每天都將進行一場直播。公司將展示一些新產品或者樣品。”消息發布后,全球多地AI概念股走強。
今年以來,在國產大模型領域中,視頻生成也成為最熱門的細分賽道之一。截至目前,騰訊、快手、商湯等企業已相繼推出視頻生成相關產品。影視行業上市公司紛紛擁抱AIGC,為主營業務賦能。業內人士認為,多模態視頻大模型歷經迭代,已逐步提升對內容制作的賦能效果,后續AI影視領域商業化空間有望打開。
AI概念再掀熱潮
北京時間12月6日凌晨,OpenAI舉行了“12天12場直播”活動的首場發布會,帶來了推理大模型o1的完整版本和進階模式,以及每月收費200美元的ChatGPT Pro訂閱服務。
稍早前,奧特曼已經在社交媒體進行了預告。他表示:“在總共12場直播中,公司會展示新產品或者樣品。”盡管奧特曼并未具體說明OpenAI計劃發布的具體產品或功能,但業界普遍預測,屆時該公司的文本轉視頻模型Sora可能公開發布。
此外,當地時間12月4日,谷歌旗下人工智能研究機構DeepMind發布了一款名為Genie2的新型模型。該模型能夠根據用戶輸入的文本描述和圖像,實時生成交互式的三維場景。用戶可以通過鍵盤或鼠標操作角色在虛擬世界中進行跳躍、游泳等互動。
上述消息發布后,全球多地AI概念股走強。中信建投證券認為,AI應用可作為新一代生產力工具。2024年北美新一代生產力工具商業化價值逐步顯現,相關標的業績持續超預期。隨著更多的開發者和用戶構建起產品生態,新一代生產力工具有望成為用戶主流選擇,迎來非線性增長的拐點。
華龍證券指出,當前AI應用尚處于大規模落地前夕,海內外大模型持續迭代,模型推理能力有望進一步提升,這將持續推動AI應用技術進步。國泰君安證券發布研報稱,隨著AI應用進程提速以及場景落地案例持續涌現,疊加云端應用與終端智能雙輪驅動產業升級,AI賽道公司迎來重要發展機遇。
多平臺上線視頻大模型
12月3日,騰訊混元大模型正式上線視頻生成功能,這是繼文生文、文生圖、3D生成之后,混元大模型的最新業務進展。
隨著OpenAI的Sora憑借DiT架構將長視頻生成效果提升至新高度,全球AI廠商紛紛加速入局,掀起了一輪視頻生成大模型熱潮。今年以來,在國產大模型領域中,視頻生成也成為最熱門的細分賽道之一。此前快手、商湯等企業相繼推出了文生視頻相關產品,字節跳動的豆包大模型也已開啟視頻生成內測。
然而,視頻生成大模型的大規模應用落地并非易事。當前視頻生成大模型的產出結果,普遍存在與用戶期望存在較大差距的問題。騰訊方面此前表示,混元文生視頻大模型主要的優勢在于可以實現超寫實畫質、生成高度符合提示詞的視頻畫面,畫面流暢不易變形。
盡管如此,騰訊混元多模態生成技術負責人凱撒在接受中國證券報記者采訪時也坦言:“現在AI視頻生成與國外相比差距較大,特別是在文生視頻領域,成熟度遠沒有想象中高。”
“文生視頻和文生圖的難度差異很大。混元文生視頻大模型生成5秒視頻有129幀,每一幀都做對是非常難的,技術難度遠高于文生圖。”凱撒進一步向中國證券報記者表示,下一步混元大模型將在規模化法則上發力,在運動維度、圖文一致性上進一步提升。同時擁抱社區,讓更多人用起來,使模型的“飛輪”快速轉動,并帶動優化模型本身。
賦能影視行業
國產視頻生成大模型在影視行業的應用探索已經開啟。今年9月,快手宣布啟動“可靈AI”導演共創計劃。李少紅、賈樟柯、葉錦添等9位導演,將依托可靈AI的技術能力,制作出品9部AIGC電影短片。9部短片將全部由可靈AI進行視頻生成,導演完全依托視頻生成大模型進行內容創作。
12月6日,上述9部影片已完成首映。“從劇本創作到場景設計,從特效到后期制作,影視內容生產的多個環節都可借助AI技術提升效率。”快手科技副總裁、快手大模型團隊負責人張迪表示,“目前AI應用于影視創作還處于早期階段,未來一年,我們希望將AI打造成相對成熟的影視級智能創作工具,推出更多定制化服務。”
影視行業上市公司也紛紛擁抱AIGC,為主營業務賦能。去年6月,華策影視便已成立AIGC應用研究院。今年9月,華策影視推出AIGC新應用“影視劇本智能創作系統”,提供“評估助手”和“編劇助手”工具,評估助手能將20-50萬字小說劇本的評估時間從3天壓縮為5分鐘,編劇助手能改進多輪對話的低效率問題。正在自研適合于微短劇開發的垂類模型,將在未來賦能微短劇行業。
華策影視方面表示,公司在AI領域的技術儲備短期內不會直接貢獻業績,其將積極探索文生視頻等新興AI技術在傳媒領域的落地應用與業態創新。
博納影業出品制作的AIGC生成連續性敘事科幻短劇集《三星堆:未來啟示錄》在抖音播出。該劇集利用AIGC技術完成了從劇本創作到視頻編輯等多種工作。博納影業表示,該短劇是公司AI視頻技術與影視深度結合方面的探索成果,AIGC是聯動影視產業上下游多模態的鑰匙,可實現降本增效并探索突破性變革。
開源證券指出,多模態視頻大模型歷經一年多迭代,已逐步提升對內容制作的賦能效果,拓寬了創作邊界,預計后續AI影視領域商業化空間將打開。
聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多企業信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。投資有風險,需謹慎。