界面新聞記者 | 張熹瓏
3月的廣州剛經歷完一波倒春寒,連日的陰雨和大風下,氣溫不斷下探。
但并沒有影響這座城市人工智能企業的“溫度”。最忙的一天,陳天接待了五、六波參觀者,有來了解發展狀況的政府部門人員,也有前來尋求合作機會的學校和醫院。這些造訪者身份各不相同,但目的指向同一個——如何在下游場景中應用大模型。
陳天是廣州云蝶科技有限公司的創始人之一,現擔任公司CTO。這家年輕的公司成立僅六年,大模型產品已經實現盈利。隨著旗下云蝶行知大模型在去年7月通過大模型備案,商業問詢明顯增加。該大模型是國內首個專注于教研科研的行業大模型。
但真正的“大模型熱”高峰出現在春節前后。DeepSeek一度“重創”美國科技股,各地“新春第一會”和政府工作報告紛紛喊話發展人工智能。字節、月之暗面、智譜華章、騰訊等密集發布新產品,再塑國內大模型格局。
杭州、深圳無疑是這場熱潮最具風頭的弄潮兒。深圳背靠騰訊、華為、比亞迪等龍頭,實現大模型產業鏈的多點開花;杭州依靠浙江大學、之江實驗室、阿里巴巴等創新主體,在通用大模型上異軍突起;上海一直以人工智能為先導產業,密集出臺政策打造“模都”。
相較之下,廣州的聲量并不大。無論是杭州、深圳為AI產業站臺的討論,還是京滬在“大模型第一城”的較量,公開的討論中都默認將廣州排除在比較對象之外。
但這不意味這個城市無意進入這個賽道。事實上,2020年,粵港澳大灣區發展拉開序幕時,廣東省大灣區領導小組以1號文形式,將琶洲規劃為廣州市人工智能與數字經濟試驗區核心片區。
琶洲位于廣州海珠區東部。去年來,海珠主動競逐大模型賽道,在市級支持下建設全國首個人工智能大模型應用示范區。這是國內首次用這種形式重點發展大模型應用。

高樓林立的琶洲,聚集著一批龍頭企業總部和其大模型項目,包括夸克大模型、唯品會“朝徹大模型”、致景科技服裝AI大模型、趣丸科技大模型等,應用于日常辦公、電商購物、文旅等場景。
目前,海珠區落地行業大模型120個,引育大模型備案項目7個,算法備案項目114個,集聚泛人工智能企業超7000家。
在備受關注的通用大語言模型上,廣州沒有多少水花。眼下,這座城市發展大模型的策略是,從通用走向垂域,更精準地鎖定細分行業的需求,要成為“垂類模型之都”。

老牌工業區轉身
將地圖定位至廣州海珠區——這是城市中部的一個島區,東西走向、四面環江。3月后,小島的東部忙碌起來——從每年一屆的家博會、建博會,到即將到來的廣交會,比起“海珠”,國內外采購商更熟知的名詞是“廣交會展館”。
第三產業是海珠區的支柱。截至2024年末,第三產業的經濟比重超過八成。
但最早期,海珠區不以第三產業見長。上世紀50年代起,廣州通用機器廠、廣州造船廠、廣州鍋爐廠等30多家大中型工業企業陸續落地,這里形成規模宏大的工業區;改革開放后,承接香港和發達國家的產業轉移,廣州市南方制漆廠、廣州百事可樂汽水廠等布局在海珠區,這里進一步發展為廣州的老牌工業區。第二產業的經濟比重一度超過40%。
不過,老工業區的標簽很快成為過去式。在珠三角一體化規劃和廣州城市功能提升的背景下,現代服務業逐漸成為廣州產業結構調整的方向。2008年后,海珠區按照全市“退二進三”的產業結構調整思路對傳統工業企業進行關停或搬遷,萬寶冰箱、五羊摩托、廣州鍋爐廠、廣州造紙廠等一批重點工業企業遷離海珠。
“上世紀80年代靠工業,90年代靠房地產的海珠區,在南拓背景下靠什么發展?這已經成為目前擺在海珠區面前最嚴峻的問題。”廣州市社會科學院曾在相關研究中提到。
城央土地有限,海珠區瞄準了總部經濟。2015年前后,琶洲再開發拉開序幕,圍繞數字經濟,海珠區以“產業先行”思路開展用地招商,不以土地財政為首要考慮條件,讓利吸引產業龍頭拍地建設總部型物業。騰訊、抖音、阿里巴巴、唯品會、螞蟻、科大訊飛等總部大樓接連亮燈。

引入“外援”為后續AI生態提供了基礎。繼阿里夸克團隊、唯品會等大模型團隊后,佳都科技也在海珠區成立了子公司,聚焦佳都知行大模型的技術研發和大規模落地應用,該大模型是國內首個交通行業大模型。
“做大模型是一個‘扎堆’的事情,就像北京做大模型要去海淀區。海珠區初步形成了大模型的聚集氛圍,也有不少互聯網代表公司,不管是前沿信息交流還是商務洽談,這邊都有優勢。”佳都科技首席AI科學家王凱向界面新聞表示。
針對海珠區的商業落地,佳都科技在去年完成了慧行大模型的備案,針對底層技術進行了升級,訓練效率提升了兩到三倍,推理的算力需求則降低了一個數量級。
這樣來看,海珠區的發展路徑跟杭州較為相似,經歷了從“電商之都”向“大模型之都”的轉變,數字經濟、產業互聯網的生態為其發展“模都”提供了基礎。
“大模型是解決問題的,產業生態越豐富,就越適合大模型企業的成長,例如阿里、騰訊具備底層技術優勢,而唯品會等電商產業對應下游用戶,也有發展大模型的需求。”陳天認為。
而原有的制造業基礎也為大模型提供了落點。海珠區坐落著國內最大紡織商圈,本土企業致景科技切入服裝AI大模型,基于款式、面料和色彩參數等行業大數據,提供設計、生產、營銷等各環節的預測和建議。

但不可否認,廣州大模型產業仍被杭州拉開了明顯距離。
“廣州和杭州有一定的相似性,都是商貿流通的重要城市。但這個過程中,杭州發展出以阿里巴巴為代表的電商生態,B端、C端沉淀了大量數據,為發展AI做了鋪墊。而廣州主打專業市場,也就是廠家到零售端中間的批發模式,保守于這種模式的紅利讓廣州錯過了抓住互聯網鏈接新渠道的機會。這種現場交易也不記錄數據,廣州也因此缺乏大數據學習的基礎。”中山大學軟件工程學院產業數字化服務中心主任、中世數字經濟研究院執行院長戴欣認為。
戴欣表示,這也反映了廣州存在的問題——此前本土對創新性的引領不明顯,在支撐原創上乏善可陳,這種積累也無法短期投資來彌補,需要找到錯位發展的賽道。
應用端錯位發展
模型研發依賴大量基礎學科研究,對人力、電力、算力要求高,是廣州短期內難以追趕的領域。這座城市瞄準應用端錯位競爭,對標垂類大模型,海珠區選準AI+教育、醫療、新型工業化、游戲等11個重點方向。
2024年3月,《廣州市支持海珠區建設人工智能大模型應用示范區實施方案》正式印發實施,這是國內首個聚焦行業大模型產業發展的方案,在應用數量上有明確指標:到2026年,推動大模型在8個以上行業深度應用,推廣典型應用場景不少于30個、儲備算法超5000個,帶動示范區主營業務收入超5000億元。
“今年我們的課題就放在這一領域,發展思路也一直是往垂直方向走。”海珠區科工商信局局長麥錳錳表示,海珠區計劃將人工智能與傳統產業進一步“黏合”起來,讓大模型落地盈利,計劃新引育大模型項目超100個,完成大模型內測超50個、上線運營超30個。

“對廣州來說,探索小場景、小模型的方式更現實。大模型原生底層的技術研發是上海、杭州等長三角城市的強項,短期內難以被反超。但是具體賽道應用上廣州是可以突破的。”由于工作關系,科大訊飛華南有限公司副總經理惲風靜常年往返于珠三角和長三角。地域優勢的差異也讓公司將不同板塊劃分給不同城市——合肥及周邊更多承擔技術研發,廣州、深圳以產品和市場運營為主。
海珠區也在國內首創規劃一個示范區發展大模型應用的模式。惲風靜看來,這種形式有幾個好處:更專注具體場景的應用落地,面向市場主體和場景的開放度也更高;另外,能給予相應政策性的鼓勵和支持,并搭建政企合作的平臺。
在AI行業,應用場景落地已進入紅利兌現期。過去一年,海珠區超50家大模型企業實現盈利,產業規模破30億元,包括多面科技的獵聘大模型、樹根互聯的根靈工業大模型、動悅信息大模型等。
陳天提到,一方面,政策對備案大模型、備案算法有相應補貼,例如算法券,此外政府也組建算力資源提供支持。這都有助于降低企業成本。
過去數年間,海珠已在數據、算法、算力方面奠定基礎。如數據方面,海珠區是全省唯一的“數據經紀人”“首席數據官”“數據生產要素統計核算”創新改革“三試點”單位,在全國率先開展數據要素市場化配置改革,已推薦9家企業成為廣東省數據經紀人,區縣級數量全省最多。
算力支撐方面,海珠實現算力超1800P、可調度算力超4900P,后續還將實現可調度算力18000P。通過政府牽頭、企業投資,建設了琶洲云腦智能計算中心等基礎設施,并引導琶洲實驗室、百度飛槳賦能中心等設施升級擴容。
百度飛槳是百度用時15年開發的深度學習框架,2023年4月在廣州落成人工智能產業賦能中心,自建有算力中心12.69P,主要用于自有模型的訓練和推理。百度飛槳廣州中心副主任陳云峰告訴界面新聞,廣州中心聚焦大模型在垂直行業的落地,中心已完成工業質檢大模型、檢察院大模型、法院大模型、高校大模型的訓練和應用。
大模型行業不是單純的市場行為,作為各地押注的新興賽道之一,其中也夾雜了政府的期待。這個背景下,G端市場被率先打開。
教育被視為大模型最重要的應用場景之一。科大訊飛去年在海珠區建設大模型示范區的契機下跟海珠區教育局簽訂了戰略合作關系,在廣州市第五中學等學校規模化應用了科大訊飛星火教師助手,這是基于星火教育領域專屬大模型開發的場景模型,可以分析老師在課堂教學環節中的教學用語,提供教研循證的課堂數據分析和針對性的教學改進建議。
云蝶行知大模型也指向教育,為教師提供備課輔助、論文輔助、課題申報輔助、行政公文輔助等教學輔助服務。陳天透露,此大模型今年預計投放到超過300所付費學校,用戶(含試用)超10萬,單品營收超過5000萬元。
“新事物打開市場并不容易,政府牽頭開放場景,舉辦對接會、介紹對應公司座談,這樣省去了我們很多協調成本。”陳天提到,公司的教育類客戶和醫療類客戶,不少就來自上述渠道。
佳都科技則結合海珠區交通路網開展大模型輔助信控優化,改變了以往交通信號燈靠人力調優的模式,業務范圍覆蓋整個區。
王凱介紹道,通過觀察路面交通實時擁堵狀況和異常事件,可進行片區級的交通信號燈優化配置。另一方面,通過大模型可以實現秒級異常交通事件檢測,在海珠區超過30個路視頻監控接入了多模態的視覺大模型,進行24小時實時分析。截止到2024年年末,AI大模型可在30秒內發現異常交通事件并輸出告警,事件識別準確率超80%。
去年開通的廣州11號線環線中,同樣運用了佳都科技基于大模型的超寫實數字客服,1比1一復刻了廣州地鐵工作人員的形象,可以解答乘客任何關于11號線的問題。

發展盈利大模型
不管是教育、交通還是醫療領域,現下海珠區的大模型場景以G端為主。戴欣認為,這是政府相對可控的資源,更容易放開。
一個行業場景打通后,市場的買單行為也隨之增加,在海珠區打樣的場景率先產品化。繼海珠區之后,佳都科技也中標了廣州花都區的交通聯動系統項目,金額達3.1億元。王凱透露,11號線的超寫實數字人,其他城市的地鐵站也有意引入。
但企業的商業版圖不止于此,這些公司也在謀求B端和C端市場。
畢竟押注大模型就是一項“燒錢”的活。以科大訊飛為例,2024年上半年扣非后歸母凈利潤為虧損4.83億元,虧損擴大的主因是大模型相關投入增加。
2024年7月,海珠放話發展“最盈利大模型”,探索出符合自身發展的盈利模式,逐漸實現商業閉環。
“盈利主要是兩方面,一個是成本,一個是市場。”陳天透露,云蝶科技在今年才開始融資,前五年都是自我造血。
DeepSeek的爆火讓外界看見國產大模型撼動全球行業格局的可能性,但行業對“小算力、高性能”并不陌生,海珠區很多行業大模型企業都在采用這一模式。
“最初做行業模型時,我們就提出知識蒸餾KTD架構,這是一個大模型垂類訓練的架構,可以快速以較低成本訓練某個領域的小模型,快速從一個行業遷移到其他行業,形成對應的解決方案。”陳天告訴界面新聞。
AI技術中,蒸餾是一種模型壓縮和優化的方法,能將一個大型、復雜的模型的知識傳遞給一個更小、更簡單的模型。陳天提到,同時配合知識圖譜和GPT技術,確保輸出的可靠性。
“DeepSeek把很多精力花在怎樣用更少資源、更高效率訓練一款新模型,以及一款模型訓練出來后用更少算力做推理,我們的思路也是一樣的。”王凱說。

佳都科技創造了“模型沙盒”體系,慧行大模型也基于此進行研發。王凱解釋道,沙盒會不斷更新,過去的實驗規律和結論可以沉淀在沙盒里,要做新模型時可以從中查找最優策略和參數配置,從而降低訓練成本。
王凱表示,公司已經沉淀了一個預訓練的基座,只需要少量樣本做微調,就可以結合具體場景快速生成對應模型算法。此前,廣州交通部門需要定制專門針對非機動車識別的算法,基于預訓練基座,不到一周就實現交付。如果沒有該基座,可能需要兩個月。
2024年,佳都科技將知行大模型迭代升級至V2.0。王凱提到,多模態是一個突破,該體系涵蓋了視覺大模型、多模態大模型和時空決策大模型,更多模態才有可能實現更全面的預測預警,解決更復雜的問題。像海珠區的信號燈調優,就運用了時空檢測大模型,得以對下一個周期、下一個階段的路面交通流進行預測。
陳天目前正在跟兩家醫療類企業接洽,科研領域會率先落地,醫生可以借助大模型生成的文獻綜述快速了解前沿動態。康復后的隨訪也有望實現,通過機器人的自動電話采集病人情況、分析和歸類。此外,將大模型搭載到鼠標和學習機上,云蝶科技要打開個人市場。
“今年會從兩個角度去拓展,第一個是場景,從教育拓展到醫療、工業。第二是技術深挖,目前更多是文本大模型,未來要研究多模態大模型,進行大模型和邊緣硬件的結合。”陳天說。
科大訊飛也在加碼C端應用。目前,政府端采購比重在四至五成,C端約兩成。惲風靜認為,B端、C端場景開放才是形成商業閉環、解決大規模落地的關鍵所在。
惲風靜設想,未來學生都有自主學習AI助手。學習助手目前更多裝載在AI學習機上,未來可能安裝在PC端或家長手機端,更精準識別知識薄弱點并推送對應教學資源、形成錯題庫,甚至協助學生進行自批改。
但不可否認,打開這個市場也有不少挑戰,如受收費敏感性、家長輿情影響,學生個性化學習路徑和方式也不在當下學校或教育局的授課方案內。但惲風靜仍強調,“從應用主體來看,以學生為中心、發展個性化學習是一個趨勢,C端市場的潛力將超過B端或G端。”