文|第一新聲 夏雨
編輯|也行
校對/Tina、Rita
策劃/Eason
據IDC預測,中國數字人市場規模預計到2026年達102.4億元。這其中不僅包括正在快速發展中的B端市場,還有被視為潛力股的C端市場。尤其是在AIGC大模型高速發展的當下節點,數字人的滲透率將會增強。
目前,諸多廠商已經入局。今年8月,華為宣布推出盤古數字人大模型,可幫助用戶 12 小時完成數字人生成。此前騰訊推出了一些基于特定場景的虛擬數字人,如平安普惠數字員工、新華社主播“新小微”、航天員“小諍”、3D手語翻譯官“聆語”、故宮博物館導游“福大人”等。阿里巴巴的虛擬數字人為自身業務需求服務,仍是以直播帶貨為主......
那么,在AIGC大模型浪潮下的數字人發展情況究竟如何?數字人將會應用到哪些場景?面臨哪些技術挑戰?成本多少?本篇內容采訪了心識宇宙產品VP陳陽、世優科技創始人&CEO 紀智輝、行業從業者李元(化名)等,試圖解答上述問題。
01、AIGC加持下,數字人開始狂飆?
騰訊發布《數字人產業報告》中,將數字人界定為“以數字形式存在于數字空間中,具有擬人或真人的外貌、行為和特點的虛擬人物。”
2023年,隨著AIGC的強勢崛起和類ChatGPT語言大模型的問世,數字人賽道變得越發熱鬧起來。開始頻繁出現在各大應用場景,以及文旅、電商、金融等多個行業,形形色色的虛擬數字人正代替真人,充當著代言人、主播、播報員、客服和智能助理的角色。
市場的參與者也肉眼可見變多。互聯網大廠、創業公司、老牌AI公司和一些此前做智能客服營銷的數字服務商和資方都躬身入局。
銳觀網數據顯示,截至2022年12月,中國數字人行業投融資事件超過140件。據IDC發布的《中國AI數字人市場現狀與機會分析2022》報告中,預計到2026年中國AI數字人市場規模將達到102.4億元。
對于數字人產業越來越熱的現象,多位受訪人總結出三個原因。
一是從技術上來看,AIGC的出現解決了數字人“只會念稿、不能交互”等諸多痛點。 生成算法提高了內容創作的效率和便捷性,降低了成本和門檻,同時還豐富了內容創作的多樣性和個性化,滿足了用戶的不同需求和喜好。自然語言處理大模型有助于提升數字人交互體驗,讓數字人從過去的“沒有大腦沒有靈魂”找到了一個比較好的出口。
與此同時,建模渲染、 AI生成動作捕捉等技術也在不斷的進步,讓整個數字人的表現比普通的 AI機器人更加像自然人,對信息、知識的挖掘和梳理更充分,對語句的處理更加貼近人類的日常交流表達習慣。
二是90后、00后為代表的“網絡原住民”,對虛擬角色的接受程度逐漸深入,很容易對虛擬角色投入情感。
三是國內數字經濟的進一步發展趨勢下,讓企業降本增效的經營需求起到了助推作用。
行業從業者李元(化名)同意該觀點,并以直播場景為例解釋,真人直播需要花費一定成本來搭建直播場景,而且隨著抖音、美團等平臺開啟本地生活直播,人才缺口也是一個問題,數字人恰好能填補這個缺口,而且能夠做到7×24小時無休。
“公司通過AI技術在數字人‘造人、養人、用人’三個不同階段均實現成本控制、規模化生產能力。在AI產品方面,今年世優科技推出了世優BOTA、世優AI數字人直播系統AI數字人產品體系。通過AI與數字人的結合應用,實現批量化打造虛擬人,為行業降本增效。”世優科技創始人&CEO 紀智輝說道。
當前,數字人的應用越來越廣泛,無論是B端還是C端都出現了數字人的身影。清華大學發布的《虛擬數字人研究報告2.0版》顯示,數字人已經滲透到各行各業,成為新一代的生產力和創造力。從頭部企業的布局來看,數字人產品服務在B端占有79%的市場,而在C端占比36%。
在數字人的B端應用場景方面,心識宇宙產品VP陳陽坦言:“主要是做客服、營銷、文旅導游以及AI直播等, 因為AI直播本質上也是在與觀看直播的用戶互動、回答用戶提出的問題。難點在于數字人客服如何快速的為交流對象提供正確的答案?基于ChatGPT大語言模型,數字人可以得到很多信息,但同時也會出現無法準確回答交流對象、甚至是編造答案的現象。這對客服場景會帶來致命的傷害。”
在數字人的行業應用落地方面,IDC的相關報告介紹,金融行業是當下數字人應用相對更成熟的領域,到2025年,超過80%的銀行都將部署數字人,承擔90%的客服和理財咨詢服務。 例如浦發銀行是國內最早“聘用”數字員工的銀行,目前3D數字人“小浦”已經在20多個崗位任職,包括財富規劃師、文檔審核員、大堂經理、電話客服等。
此外,企業的數字人可以與內部系統綁定,員工可以跟它交流了解公司的規章制度,查詢各種信息等。
未來,數字人將在醫療、教育、制造等多個領域發揮作用,例如在醫療領域,數字人可以作為認知智能大模型,輔助醫生進行診斷和治療;在教育領域,數字人可以作為個性化教學助手,幫助學生提高學習效果。
接受采訪的幾位業內人士都表示,未來C端也是一個比較有潛力的市場,未來可能人人都會有一個屬于自己的數字人,但從成本、技術、設備來看,還需要經歷一段時間的發展。
02、難以逾越的成本高墻,3D數字人成本達100萬
想要躬身入局的企業,需要懂得計算投入產出比。
目前,數字人分為兩類,一類是由人驅動的“中之人”, 是指依靠人力驅動虛擬主播進行直播,這種驅動方式需要進行大量的拍攝及后期工作,成本較高,眾多3D虛擬人采用的便是中之人驅動。
另一類是AI驅動數字人, 指通過使用機器學習,喂養數據等方式訓練數字人完成特定的任務。這類數字人通常應用于工作重復量高的服務型場景,目前在直播間帶貨的2D真人數字人大都屬于該類。
3D數字人往往以動畫人物形象出現,適用于虛擬IP的打造。對于該類型數字人來說,從面部輪廓到服飾場景都需要自定義打造,成本通常會更高,制作周期也會更長,報價超過20萬元。
例如英偉達曾在官方博客中稱,黃仁勛虛擬人在發布會上出鏡的14秒視頻,共有34位3D美術師和15位軟件工程師協同參與,總計近千工時。
這樣高昂的成本得到了李元的證實,“在傳統的3D建模技術下,一個能看得過去的定制數字人,需要幾十萬的成本,這還只是冰山一角。”
據世優科技CEO紀智輝介紹稱,市場一般將數字人成本分為3部分,即造人、養人、用人。第一部分是造人,通過角色創意、原畫、建模、綁定、表情、實時渲染等環節,可按照風格生產出卡通Q版,迪士尼人形、二次元、次世代、美型寫實、超寫實等不同風格。價格從幾萬到上百萬不等。
第二部分是養人 ,當數字人被造出之后,還需要低成本、高頻不斷的輸出內容,用數字人生成內容,養出IP認知度。例如數字人需要出一條短視頻或者一條TVC廣告片,其成本則是根據內容的精度、效果以及腳本內容不同等因素來決定,一分鐘成本從幾千、幾萬到幾十萬不等,主要取決于腳本的難易程度。
第三部分是用人 ,主要是指數字人生產內容后所應用的場景。“ 目前,世優科技在用人方面涉及十大應用場景,包括廣電媒體、品牌營銷、電商直播、短視頻、政府文旅、教育娛樂、影視劇、 AR/VR/AI 、NFT、元宇宙等各類線上線下場景。比如數字人做虛擬主播、媒體記者、活動主持人、線下展廳接待員等等。根據客戶的項目需求,涉及相關執行的成本。”紀智輝說道。
不同類型的數字人所產生的成本差異較大,應用AI生成技術研發的2D數字人相比之下,成本便宜很多。“整體來說,2D數字人的成本只有3D的1/10或者1/20,這是目前相對接地氣、市場上容易接受的水平。”紀智輝說道。
世優科技擁有2D數字人相關產品線。2D不需要建模,生產過程也相對簡單,主要是通過拍攝一段真人視頻后通過AI技術訓練而成,造人成本只需要幾千塊錢。在養人生成內容方面也只需要輸入腳本,數字人就能講話做到對外輸出,養人成本只需要幾塊錢/分鐘,之后會接近于0。
當然,2D數字人并不能適用于所有場景,在游戲場景和虛擬偶像這樣的賽道中,企業只能使用高價的3D數字人,成本負擔可想而知。而且無論2D數字人還是3D數字人,都面臨著內容劣勢。
今年5月抖音發布AI標識令,開始監管數字人這一新物種。在內容上沒有競爭力,只會重復口播的大量2D數字人被封禁。紀智輝提到,因為抖音、快手、微信是內容與電商平臺,所以主播必須提供高質量的內容。而AI生成的部分內容質量不高,平臺就不給流量,最終導致了東西賣不出去。所以數字人實現高銷量的帶貨,是需要配備運營團隊、好的貨盤等好幾個因素疊加才能把帶貨ROI做好。
至于大眾對于AI所引發的“換臉”、“永生”等風險的擔憂,李元表示:“任何新技術的出現和應用都需要一些相應的規范,監管也在做出反應。今年1月份,有關部門就出臺了AI生成內容的一些監管政策。市場內的正規廠商對此也很重視,這些廠商都有自我規范和要求。”
03、三個技術難題,數字人無法像人“生動靈活”
值得注意的是,當下大模型驅動的數字人產品仍處于應用落地的早期階段。除了上述提到的成本制約因素以外外,業界普遍認為現階段,技術成熟度和效率也仍然是數字人的難題之一。
有研究報告將數字人的特征總結為3點,但技術在這些特征上的呈現均有許多不足之處。
一是數字人擁有人的外觀,具有特定的相貌、性別和性格等人物特征。
“如果客戶不選擇超寫實數字人,即完全復刻一個真人的狀態,那么數字人的外觀技術已經較為成熟了,只是數字人的表情、動作仍有卡點。但是在沒有真人動捕而是完全通過自我驅動的情況下,數字人很難呈現出自然的表情和動作。”陳陽說道。
二是數字人擁有人的行為,具有用語言、面部表情和肢體動作表達的能力。但不少數字人產品在語音、表情、互動表現上目前還比較生硬。
李元認為,由于數字人缺乏情緒、情感的表達能力,例如在感到生氣或委屈時,無法用更豐富面部表情和更大的肢體動作來呈現,導致數字人雖然擁有了人的外貌、聲音,卻無法像人一樣生動靈活的原因。
三是擁有人的思想,具有識別外界環境、并能與人交流互動的能力。
“雖然ChatGPT的出現賦予了數字人大腦,但如果市場希望刻畫一個有特定個性,甚至有自己成長經歷、世界觀的一個角色,單純使用ChatGPT很難實現,目前整個技術還不能很好的支持這個事情。”李元說道。
據悉,目前AI還不夠智能,這導致智能驅動型(TTSA人物模型)的交互型數字人只能作為補充型的角色存在(游戲場景除外),市面上仍以真人驅動的為主,比如在視頻直播和展臺上的充當主播的數字人。
陳陽觀察稱,展臺會用全息技術投訴一個角色與訪客互動。AI驅動的數字人則主要是充當文旅導游,同時在一些淘寶直播間也會出現,在真人主播無法覆蓋的時間段,會使用這樣的數字人,應用場景比較有限。
不過紀智輝認為,隨著AI技術發展,未來AI驅動型的交互型數字人市場可能會比較廣闊。真人驅動型數字人會更適合進3D空間實時互動,比如3D數字人實時互動直播、元宇宙這樣的應用場景。
從年初熱鬧至今,從業者與客戶們也觀察到,市場已經在呈現理性回歸狀態。一些喧囂和割韭菜類的廠商與代理商等角色在加速出清,希望未來數字人真正為企業實現降本增效。