文|劉永東
2024年,科技界迎來(lái)歷史性時(shí)刻,在國(guó)外,OpenAI正式推出了視頻生成大模型Sora; 在國(guó)內(nèi),快手率先推出了自研的視頻生成大模型“可靈”。這一創(chuàng)新標(biāo)志著AI技術(shù)從文本生成邁向視頻生成的新階段,也將“視頻生成”從實(shí)驗(yàn)室概念轉(zhuǎn)變?yōu)槟軌蚰M現(xiàn)實(shí)世界的強(qiáng)大工具,預(yù)示著AIGC(人工智能生成內(nèi)容)領(lǐng)域?qū)⒓铀儆瓉?lái)紅利期。
技術(shù)進(jìn)步:從嘗試到飛躍
在數(shù)字化浪潮的推動(dòng)下,信息的傳遞與接收渠道變得前所未有的多樣化。視頻憑借其獨(dú)特的多維信息展現(xiàn)能力、豐富的畫面表現(xiàn)以及生動(dòng)的動(dòng)態(tài)特性,已躍升為信息傳播領(lǐng)域的核心力量。與單純的文字描述和靜態(tài)圖像相比,視頻能夠無(wú)縫集成文本敘述、直觀圖像、生動(dòng)聲音及精細(xì)的視覺(jué)效果,于一幀幀畫面中交織出多層次的信息網(wǎng)絡(luò),為觀眾帶來(lái)深度體驗(yàn)與沉浸享受。這種融合多種感官刺激的表達(dá)方式,極大地增強(qiáng)了信息傳遞的效果與感染力。
我國(guó)龐大的互聯(lián)網(wǎng)用戶群體和豐富的短視頻內(nèi)容資源,為視頻生成大模型的訓(xùn)練和發(fā)展提供了海量且高質(zhì)量的基礎(chǔ)數(shù)據(jù)支持,具備發(fā)展視頻生成大模型的天然優(yōu)勢(shì),已經(jīng)涌現(xiàn)出如快手“可靈”、商湯“Vimi”、智譜“清影”、愛(ài)詩(shī)科技“Pixverse”等諸多產(chǎn)品。作為短視頻直播平臺(tái),快手“可靈”具有獨(dú)特優(yōu)勢(shì),不僅在生成速度、視頻時(shí)長(zhǎng)、連貫性、美觀性、逼真性等硬指標(biāo)上表現(xiàn)不俗,更對(duì)復(fù)雜指令能夠精準(zhǔn)理解和創(chuàng)造性執(zhí)行,使得AI生成的視頻內(nèi)容貼近人類創(chuàng)作水平。
賦能應(yīng)用:從想象到現(xiàn)實(shí)
Sora和“可靈”等大模型產(chǎn)品的發(fā)布不僅彰顯了AI在視頻生成領(lǐng)域的巨大潛力,還極大地激發(fā)了人們對(duì)于其廣泛應(yīng)用場(chǎng)景的想象。在教育領(lǐng)域,視頻生成技術(shù)讓虛擬實(shí)驗(yàn)、歷史場(chǎng)景再現(xiàn)成為可能,極大地豐富了教育資源的多樣性和個(gè)性化;在游戲開(kāi)發(fā)方面,AI生成的游戲場(chǎng)景、角色和劇情降低了開(kāi)發(fā)門檻,提升了游戲可玩性和多樣性;在醫(yī)療領(lǐng)域,視頻生成技術(shù)輔助模擬手術(shù)、展示病灶,為醫(yī)生提供直觀的診斷依據(jù);在文娛產(chǎn)業(yè),AI不僅輔助編劇,還能自動(dòng)生成場(chǎng)景、角色、特效,顯著縮短制作周期、降低成本。目前,李少紅、賈樟柯、葉錦添、薛曉路、俞白眉、董潤(rùn)年、張吃魚、王子川、王卯卯9位導(dǎo)演正在依托“可靈”大模型制作完全由AIGC生成的電影短片,大模型將展現(xiàn)“電影級(jí)”能力。
行業(yè)落地:從概念到實(shí)踐
在短短半年間,視頻生成大模型迅速完成了從技術(shù)創(chuàng)新到探索落地,再到廣泛商業(yè)應(yīng)用的轉(zhuǎn)變。如在電商領(lǐng)域,視頻大模型已經(jīng)實(shí)現(xiàn)了實(shí)質(zhì)性的“賦能”,實(shí)實(shí)在在的“提質(zhì)增效”。商家可以利用AI快速生成產(chǎn)品展示視頻,以更直觀、生動(dòng)的方式向消費(fèi)者展示商品的特點(diǎn)和優(yōu)勢(shì)。這不僅提升了購(gòu)物體驗(yàn),還促進(jìn)了商品的銷售轉(zhuǎn)化。以快手為例,基于“快意”大模型構(gòu)建的視頻腳本生成、直播實(shí)時(shí)腳本生成、廣告線索客服等功能,結(jié)合數(shù)字人技術(shù),幫助廣告主低成本生成高品質(zhì)內(nèi)容,提升了線索轉(zhuǎn)化效率,使得快手AIGC月活躍客戶數(shù)從年初至今增長(zhǎng)了8倍,月GMV規(guī)模提升了64倍,平臺(tái)AIGC廣告收入規(guī)模提升了12倍,AIGC營(yíng)銷素材在6月單日消耗峰值突破2000萬(wàn)。截至目前,“可靈”AI已經(jīng)累計(jì)服務(wù)超過(guò)260萬(wàn)用戶,生成5300萬(wàn)張圖片、2700萬(wàn)個(gè)視頻,顯示了大模型在商業(yè)場(chǎng)景中的巨大潛力。
未來(lái)展望:機(jī)遇與挑戰(zhàn)并存
我國(guó)高度重視生成式人工智能的發(fā)展,《中共中央關(guān)于進(jìn)一步全面深化改革、推進(jìn)中國(guó)式現(xiàn)代化的決定》明確提出要“完善生成式人工智能發(fā)展和管理機(jī)制”。各級(jí)政府也在積極推進(jìn)相關(guān)政策的落地實(shí)施,圍繞生成式人工智能的算法、算力、數(shù)據(jù)、場(chǎng)景、人才等方面不斷部署,多渠道、多手段支持生成式人工智能的發(fā)展。
與此同時(shí),視頻生成大模型的廣泛應(yīng)用,也帶來(lái)了一系列挑戰(zhàn)和問(wèn)題,如創(chuàng)作范式的變革?!拔纳曨l”“圖生視頻”的創(chuàng)作方式完全不同于原有的電影視頻創(chuàng)作,需要盡快研究相關(guān)教程,幫助大模型更好地賦能創(chuàng)作。此外,由于生成內(nèi)容的逼真性不斷提升和門檻不斷降低,如何確保生成內(nèi)容蘊(yùn)含的真實(shí)性、避免虛假信息的傳播,如何保護(hù)知識(shí)產(chǎn)權(quán),這些問(wèn)題都需要我們共同面對(duì)和解決。近日,國(guó)家互聯(lián)網(wǎng)信息辦公室已經(jīng)發(fā)布《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法(征求意見(jiàn)稿)》相關(guān)規(guī)定。在政策的引導(dǎo)下,視頻生成行業(yè)將會(huì)更加規(guī)范、健康地發(fā)展,為社會(huì)進(jìn)步和繁榮貢獻(xiàn)更大的力量。
大模型邁入規(guī)模化應(yīng)用期,視頻生成紅利加速顯現(xiàn),這不僅是AI技術(shù)的又一次飛躍,更為我們開(kāi)啟了一個(gè)充滿無(wú)限可能的新世界。相信在各方共同努力下,以視頻生成為主導(dǎo)的AIGC將加速落地,賦能各行各業(yè),推動(dòng)社會(huì)向更加美好的未來(lái)邁進(jìn)。
(本文作者所屬單位:國(guó)家工業(yè)信息安全發(fā)展研究中心)