文 | 讀娛 零壹
3月份以來,AI和短劇再次成為視聽行業的核心關鍵詞。在近日舉辦的第十二屆中國網絡視聽大會上,國家廣播電視總局網絡視聽司司長馮勝勇在論壇致辭中表示“提出一個問題往往比解決一個問題更重要”的時代來臨。
無論是愛奇藝、芒果TV、騰訊視頻等綜合視頻平臺,還是抖音、快手、嗶哩嗶哩,AIGC、微短劇+幾乎是所有行業大佬的核心議題,無可置疑的風口中央。
在Sora發布后,以即夢、快手為代表的國產AI視頻大模型在短短一年多時間里加速,經歷了從“跟跑”到局部領先的過程。
而從內容端的反饋來看,從早期的代表性AI短劇如去年的《山海奇鏡之劈波斬浪》和《三星堆:未來啟示錄》,到今年來話題性頗高的《美猴王》《無名特工隊》和《紅衣大叔用AI帶我穿越》《興安嶺詭事》,以及發布預告不久的單元劇集《新世界加載中》,技術進步和內容創作者不斷探索后的內容質感迭代是明顯的。
但即便進步顯著,截至目前一個很明顯的事實是,AI短劇所引發的討論更多仍停留在技術層面,內容本身收獲的正面評價是非常有限的。總結過往作品的大眾反饋來看,迄今為止AI短劇的的幾個主要問題是:
敘事方面,連貫性不足,單鏡頭時長普遍低于5秒,依賴快速剪輯規避動作邏輯缺陷,鏡頭語言單一、動態PPT拼接感嚴重;
視覺層面,人物表情僵硬、口型與發音錯位、情緒表達失真導致恐怖谷效應,普遍以單一角色動態場景呈現,缺乏多角色之間的交互,復雜場景模擬缺陷明顯,普遍問題是精細度有余而真實性不足,乍一看驚艷,再一看穿幫。
題材和創意層面,劇情類幾乎全部集中于玄幻、科幻賽道,此外還有文化科普類短紀錄片的形式呈現,其目的顯然是發揮AI在視覺奇觀打造上的優勢,而盡量降低在一致性、現實性層面上的不足。
而更為隱蔽的問題則是內容創意,以現有AI大模型產出的劇本大綱和分鏡腳本可用性是非常有限的,要么完全缺失邏輯性,“不是現在的人類能接受的藝術”,比如《紅衣大叔用AI帶我穿越》;要么則是網文和網大敘事模版的套用,在AI技術的外皮下包裹一些極為粗糙和陳舊的精神內核,這部分是目前的主流AI短劇內容,都缺乏藝術層面的突破性,如果是這樣那么AI短劇相較于普通微短劇,似乎稱不上有明顯優勢可言。
這些問題在2025年3月來看,比2024年的前期作品如《白狐》《三星堆:未來啟示錄》都有明顯改善,但如今的AI短劇行業狀態也許可以這么形容——“能夠批量生產59分作品,但及格作品還在個位數,真正的高分作品還是零。”
也就是說,目前AI短劇還在“有沒有”的階段,但普通觀眾在乎的是“好不好看”。
過去一年,AI短劇的飛速發展和階段性痛點
在探討AI短劇的發展方向之前,我們不妨先總結下目前AI短劇的創作內容流程。通過參考一些AI短劇教程,并詢問一些個人興趣AI短劇創作者,純AI流程的AI短劇實操過程基本是這樣的:劇本生成-分鏡腳本-圖像生成-圖生視頻-剪輯優化。
劇本生成和分鏡腳本可以借助ChatGPT或者Deepseek、Claude模型等輔助生產,以Deepseek為例,其可根據提示詞生成包括場景編號、時長、景別、鏡頭運動、場景描述(畫面/光影)、關鍵音效在內的分鏡腳本,并以表格形式呈現。
如下圖是讀娛讓deepseek生成的一段中世紀克蘇魯懸疑風格的故事梗概和分鏡腳本(部分截圖):
然后是文生圖,隨著創作者完善分鏡腳本這一步后,再使用MidJourney、可靈、即夢、vidu等工具完成文生圖,以合理的提示詞形成視覺畫面。
即夢等平臺的故事創作模式支持批量導入分鏡圖片,以清晰化創作流程;
即夢的“故事創作”界面
接著是圖生視頻。將視覺圖片按順序保存后,通過可靈、即夢、Vidu等圖生視頻工具使用首尾幀和提示詞形成視頻;
即夢與可靈的視頻生成界面
最后通過AI音效、臺詞等方式添加聲音部分、再進行剪輯優化最終成片。
這一流程的邏輯大體與傳統影視產業一致,區別在于極大降低了劇本生成到分鏡、拍攝制作的成本,有極為寬松的試錯空間。
但對于目前的創作者而言,實際操作則遠不如看上去那么簡單。
一位個人AI短劇創作者告訴讀娛,即便他只是基于興趣來創作要求不算高,但他的AI短劇每一分鐘成片都需要花費二、三十個小時的時間,一個重要的原因就是要選片并保持一致性,而把大量的時間花費在出三視圖,以及調整提示詞來“抽卡”上。“文生圖和圖生視頻兩個階段都有很大的不確定性,而目前基本只有靠不斷調整提示詞并重復的方式,能不能有好的效果,有運氣成分在里面。”
而在具體創作中的另一個矛盾是,要實現視頻效果很容易依賴多圖堆積下的抽獎結果,但這樣的操作往往又容易導致一致性不足。
如果對效果有一定要求,從前期到后期依賴AI的自動化也是完全不現實的。比如目前的個人AI短劇往往是由大量“一個鏡頭一個人說話”的單一鏡頭拼接而來,與大眾熟悉的影視語言有明顯差距。如果想要實現更豐富的鏡頭效果,那么前期分鏡基本不能指望用deepseek等AI模型直出直用,還是要靠創作者自己對鏡頭的理解來創作分鏡腳本,因為deepseek的分鏡很容易寫的很豐富,但并不具備合理的鏡頭語言邏輯,也完全不會考慮在即夢、可靈等圖生視頻的局限性。
那么再回到行業的話題來說,目前AI短劇創作階段的工具局限,也許可以歸納為“確定性不足”和“集成度不夠”。
前者主要體現在,創作者需要在文生圖和圖生視頻兩個階段,為了一致性這個基本要求付出太多,不僅增加了大量工作量,也更難在視覺細節和鏡頭運動等層面進行過多調整,到底應該用怎樣的提示詞,怎樣實現理想中的運鏡等,存在玄學的成分;
后者則體現在目前的各個流程基本都要使用到多個AI工具,但不同工具之間沒有協同性,像deepseek給你的腳本和提示詞,根本不會考慮你在可靈、即夢上實現的效果如何。而市面上的一些集成的AI短劇平臺則往往因為存在短板,導致功能雖全但實際價值卻不高,比如昆侖萬維的AI短劇平臺SkyReels集成了劇本、分鏡、3D生成大模型等,聲稱能通過AI一鍵生成完整劇本、分鏡、人物對白與BGM,但實際應用的完成效果卻也是問題多多,導致使用者并不算多。
所以目前主流內容才會是“PPT式AI短劇”。因為放棄或者減少多人交互、復雜運鏡的不確定性,才能更高效地產出基本邏輯合格的內容。
但這樣的內容,顯然不可能是AI短劇的最佳模式。
AI短劇未來爆發的主力,也許在“普羅大眾”
目前的AI短劇生產者,大致可以分為以下兩類:
其一是專業影視機構和主流媒體,如此前博納制作的《三星堆:未來啟示錄》,央視制作的《美猴王》、AI全流程微短劇《中國神話》《AI看典籍》等,類型往往是傳統文化、科普紀錄片等元素;
其二是個人創作者和基于個人創作者的小型AI工作室。如《山海奇鏡之劈波斬浪》《無名特攻隊》背后的創作者閑人一坤,其曾在接受采訪時提及自己團隊只有10人;而更多的個人創作者正在抖音、快手等平臺上以雨后春筍的速度出現,個人即團隊。
一個或許有些反直覺的現象或許是,個人創作者的作品質量未必比機構和團隊差。目前抖音和快手上一些粉絲量僅數百的用戶,已經能夠產出運鏡復雜、邏輯非常通順的短片,觀感已經很接近劇集,甚至還要超過上述經常見諸報端的這些AI作品。
以目前的AI短劇工具而言,團隊的規模更多影響的是生產效率,而在生成質量上的優化邊際效應很低。打個比方10個人的團隊和1個人的團隊,前者有把握能做得更多,卻沒把握做得更好。因為AI極大簡化了“制作出品”的部分,但出品的差異化卻完全依賴創作者的提示詞熟練度和個人審美、鏡頭感等。
有幾位創作者告訴讀娛,在目前AI短劇效率和效果優化的實現,水平高下主要就體現在提示詞和運鏡能力上。有的創作者能把提示詞寫得極具畫面感且與AI工具的協同性非常好,甚至可以僅憑借三到四張圖片就生成出連貫的運鏡,讓觀感往真人劇上大大靠攏。
結合當下的情況來看,對于AI短劇的未來發展,讀娛姑且大膽做以下推斷:
在專業影視制作領域,AI會在創作流程中融為一體,隨著AI作為技術噱頭的標簽被弱化,其存在感會越來越低,但應用場景則會越來越多。其實在當下的3D國漫行業中,AI的使用已經超出了許多普通觀眾的意料了,此處不做展開。
而當下定義的“AI短劇”,其爆發會來自大眾創作者的無窮智慧。隨著創作門檻被極度降低,“一人劇組”成為常態,普羅大眾創意所產生的量變,會推動AI短劇的“奇點”出現。
除了網絡視聽大會上的集中討論外,近期還有幾個業內事件暗示著AI和短劇兩個熱點疊加的蘊藏能量正在劇增。
2025年3月28日,OpenAI發布了其最新的多模態模型GPT-4o,這一技術突破再次引發了全球對AI生成內容的關注,網友通過GPT-4o生成的“吉卜力風”圖片瞬間成為全球社交網絡新興熱點,轉換真實照片為梵高、皮克斯、南方公園等風格玩法也呈現出了驚人的和諧效果。
對于AI短劇而言,GPT-4o直接處理多模態輸入,在多輪交互中能精準的遵循指令,這種對敘事和角色設定一致性的賦能將極為可觀。從一些業內人士使用后的反饋來看,GPT-4o在一致性這方面的優勢會很快體現在設計端,因為實用性大大提升,尤其在游戲領域、影視領域的概念圖和分鏡圖等方面。OpenAI 的CEO 薩姆·奧爾特曼表示,這將開啟創作自由的新高峰。
而在快手近期的財報電話會上,快手聯合創始人兼CEO程一笑表示有信心目前可靈AI“圖生視頻”功能的綜合效果處于全球第一的位置。且截至2025年2月,可靈AI累計營業收入超1億元,程一笑表示快手會不斷升級以可靈為代表的AI商業化變現模式,力爭可靈AI早日成為營收規模全球第一的視頻生成AI應用。
國產AI視頻大模型已從技術驗證邁入規模化應用階段,依托短視頻平臺的流量與數據優勢,快速迭代并探索出可行的商業化路徑。而未來競爭焦點將轉向長視頻敘事能力、多模態交互深度及產業滲透率,而技術開源與合規性很可能將成為下一階段分水嶺。
這兩個事件其實都映照出一個未來——圖片、視頻AI的技術爆發還遠未停止。
可靈的發展和商業化成就,其實反而映照出這AI視頻平臺的激烈競爭和快速進化程度,其商業化的實現也是這種競爭可持續的體現;
而GPT-4o能夠用極為簡單的方式生成連續圖片,高度保持一致性。自媒體《知危》發布的文章就顯示,作者只給了GPT-4o一張Doge圖,GPT-4o就幫他畫好一整個RPG游戲。作者寫道:“GPT-4o 展現了精準的指令遵循、驚人的圖像一致性,這種能力,正是將技術從工具升華為創作伙伴的關鍵所在。”
而在可靈、即夢等平臺上,已經有很多創作者將GPT-4o加入流程之中。
所謂創作自由的新高峰,其實就是目前制作層面門檻的進一步消除,而對個人創作者在提示詞、視聽審美、劇本情感等等層面的高層次考驗更進一步。
此外,目前的多數AI短劇仍在“模仿”真人劇,而顯然未來的可能性遠不止此,在短視頻平臺上已經出現一些“只有AI才能做出的劇”,差異化觀感,主要來自創作者自己天馬行空的腦洞。
在過去,一個普通人不太可能真正有機會去證實自己在影視創作上的天分。但如今AI短劇帶來的最大變化,就是讓每個人都真正有了成為編劇、導演的機會了,只需要極低的金錢成本,極低的試錯成本,和提供給AI的無窮創意和精確指令。