文|數智界 祝彰
編輯|嘉辛
1950年,英國科學家圖靈在一篇論文中預言,人類有可能創造出具有真正智能的機器。
著名的「圖靈測試」就此誕生:如果一臺機器能夠與人類展開對話,而不被辨別出其機器身份,那么稱這臺機器具有智能。
也是從那時開始,人類世界開始了對人工智能長達半個多世紀的探索,但至少在2000年以前,困難總比驚喜多,人工智能還經歷了兩次發展寒冬:
一次是在1974-1980年,受限于計算器計算能力,AI技術研究遇冷,研究資助被大規??s減甚至取消;另一次是在1987-1993年,期間人工智能計算機DARPA的失敗為AI潑了一盆冷水。
失敗也不全是壞事。跌跌撞撞盛衰起伏的過程中,AI的發展在2006年以后邁進了新的階段——由機器學習邁入了深度學習階段,離真正的人工智能更近。
自此之后,人類對AI的探索之旅明顯加快,一些重要的里程碑時刻相繼出現了。比如2014年,第一臺通過圖靈測試的計算機誕生,它讓人類相信它是一個13歲的男孩;比如2016年,ALphaGo戰勝圍棋世界冠軍李世石。
再到2022年底,ChatGPT一夜爆火。
不過,縱觀AI的曲折進程,技術與實驗成功之間隔著一道墻,實驗成功與大規模應用之間又隔著一道墻,應用落地與最終的商業化之間,也隔著一道墻。
這導致,我們依然無法對AI的進程抱有太高的期待,包括當下火熱的ChatGPT。
一、ChatGPT為什么能爆火?
2022年下半年,科技界最受矚目的大事件,莫過于美國的人工智能研究公司OpenAI發布了ChatGPT。
ChatGPT是一個智能對話系統,用戶在注冊后,能夠對這個系統發出各種各樣的提問,系統自動生成答案。
最開始,沒有人會想到,這樣一個只是提供人機交談的系統,卻成了2022年全球最后一個爆款產品。
OpenAI 11月30日發布了它,短短一周后,全球范圍內已經至少有100萬人在使用它。
OpenAI的公司估值也水漲船高。根據媒體1月10日的相關報道,微軟計劃向OpenAI投資100億美元(合人民幣677.51億元)以收購其49%的股權,目前雙方正在談判,預計OpenAI投后估值將達到290億美元。
再到1月12日凌晨,OpenAI在社交平臺上表示,其開始考慮對ChatGPT進行收費,以實現商業化,可能包括ChatGPT Professional(專業版)、每月訂閱付費等方式。
短短半個月的時間,ChatGPT實現了一定程度的規模化、贏得了高估值、還將商業化提上日程,它的成長速度足以令人咂舌。
ChatGPT能短時間內爆火的原因,數智界認為有兩點:
第一,從表層來看,ChatGPT表現得更聰明了。
ChatGPT不只能回答簡單的知識性問題,還能夠回答開放式問題,并且能與用戶進行多輪對話。比如用戶此前在社交媒體上分享的問題中,就包括了讓ChatGPT寫代碼、與ChatGPT聊人生哲學、讓ChatGPT寫詩等等。
在很多問題場景下,ChatGPT都給出了出乎意料的回答。比如下面這段,ChatGPT用魯迅的文筆描述網友的心情:
“在疫情的蔓延中,我困了門里,困了心里。屋外一片荒涼,想起一頓火鍋的香味,瞬間讓我心慌。這時候我才知道,疫情來臨,它讓人生無聊而悲涼,也讓我們看到自己的無助與弱點。然而我們又豈能放棄對美好的追求,豈能把欲望壓抑到不想吃火鍋的地步?”
第二,ChatGPT的走紅背后,AI大模型正在成為行業趨勢。
人工智能中,NLP(自然語言理解)是一個核心概念,被稱作是人工智能皇冠上的明珠。
在NLP中,之前往往需要對單個小任務進行訓。比如要讓AI掌握對話的能力,需要一個小模型、要讓AI學會協作,需要另一個小模型、要讓AI能閱讀能理解,又需要另一個小模型。
但是人工智能從機器學習階段邁入到深度學習階段之后,現在單個大模型就可以完成各種類型的任務訓練,也就是對不同問題在同一個模型上進行預訓練。
深度學習里有個Double Descent現象:隨著模型參數變多,測試錯誤率會先下降、再上升,然后第二次下降。原則上,在成本可接受的情況下,模型越大,準確率越好。
具體到ChatGPT的發展來看:
2018年第一代GPT面世時,OpenAI還只是用它來做語言理解方面的任務;
2019年GPT-2,得益于更高的數據質量和更大數據規模,其生成的故事在流暢度和邏輯性上更加完善;
2020年的GPT-3,更加完善成了一個大型語言預測和生成模型,能夠生成長序列的原始文本,語言處理更強大、更快,甚至無需任何特殊的調優;
再到當前的GPT-3.5,則是一個多模態大模型,比起之前的版本更加成熟、準確率越高。
二、ChatGPT的商業化前景如何?
僅當前來看,ChatGPT的表現已經帶給了人類驚喜,但必須要知道,它現在依然面臨著一些缺陷。
比如在回答某些問題時,它可能給出看似合理、實則是錯誤乃至荒謬的回答;比如你反復問同一個問題,但是用不同的話術,很可能會得到前后不一的答案;比如它的很多回復過于冗長;比如它現在還無法完全拒絕一些不合理、不道德的請求;
但這些問題的存在并不會完全阻斷ChatGPT的商業化路徑,OpenAI考慮通過專業版和每月訂閱付費開始商業化,就說明了這一點。
國海證券在一份研報中指出,隨著ChatGPT的不斷調優,其有望在醫療、客服機器人、虛擬人、翻譯、營銷、游戲、社交、教育、家庭陪護等多個領域被應用,潛在的商業模式存在以下幾種:
云服務——客戶使用ChatGPT的云服務來支持他們的聊天機器人應用程序;
內容營銷——ChatGPT根據用戶的興趣和喜好向用戶推送廣告;
數據盈利——ChatGPT生成的大量數據,包括會話日志和客戶反饋,這些數據可以通過出售給第三方或用于改進ChatGPT的功能來變現;
咨詢服務——ChatGPT可以分析客戶對話并提供見解和建議,以改善客戶體驗;
版權授權——ChatGPT可以授權給希望在自己的聊天機器人應用程序中使用其功能的客戶。
當然,以上這些潛在的商業模式,實際上是整個對話式AI都面臨的巨大空間。ChatGPT只是作為其中最具代表性的AIGC文字內容生產工具之一,優勢更明顯。
我們也看到,基于ChatGPT的商業潛力,很多科技巨頭都在加快布局。反應最快也最激烈的,是微軟。
早在2019年,微軟就向OpenAI投資了10億美元,前段時間ChatGPT爆火后,微軟又傳出欲以100億美元收購OpenAI的消息——如若交易達成,這將成為微軟迄今為止最大的一筆投資。
最新的消息是,微軟CEO納德拉表示,微軟計劃將ChatGPT等OpenAI的人工智能工具整合進公司所有產品,并將其作為平臺供其他企業使用。
一個有趣的細節是,此前微軟盡管多年來連續投資OpenAI,但比爾·蓋茨并不喜歡這項投資,他對OpenAI的技術持懷疑態度,認為其部分側重于計算機掌握人類語言含義的能力。
但是在1月12日的一次活動中,當被問及如何看待ChatGPT時,他表示,“這讓我能一窺未來,整個平臺的方法和創新速度都令我印象深刻。”態度已然轉變。
三、ChatGPT會取代搜索引擎嗎?
ChatGPT爆紅之后,其在編程、文本生成等NLP領域強大的能力已經引發了部分行業的擔憂。
比如由于ChatGPT擁有基于對話形式接收輸入指令并輸出結果的能力,與傳統的搜索引擎功能具有一定的重合。
我們也看到,最近搜索引擎巨頭谷歌動作頻頻,顯然感受到了ChatGPT帶來的壓力。
據媒體報道,谷歌CEO Sundar Pichai參與了一系列探討谷歌AI戰略的會議,同時公司的研究、信任與安全等部門和團隊,將被組織重整,旨在幫助開發和發布新的AI原型和產品。
谷歌還要求員工開發能夠創建藝術品和其他圖像的AI產品,對標的正是OpenAI的另一項產品DALL-E,一個可以根據書面文字生成圖像的人工智能系統,目前已經吸引到超過300萬用戶。
報道還指出,谷歌管理層已經發布了“紅色代碼”警報。在硅谷,這就意味著拉響了“火警”。
谷歌擺出積極防御姿態的同時,關于ChatGPT會不會取代搜索引擎的討論,也一再升溫。
去年12月,摩根士丹利投行的首席分析師Brian Nowak在一份研報中提到,語言模型可能會占據市場份額,并破壞谷歌作為互聯網用戶入口的地位。
專欄作家Parmy Olson也撰文指出,相比谷歌搜索抓取十億個網頁內容編制索引,然后按照最相關的答案對其進行排名,包含鏈接列表來讓你點擊,ChatGPT可以直接基于它自己的搜索和信息綜合的單一答案,回復流程更加簡便。
不過就目前階段而言,說ChatGPT可以直接取代搜索引擎,恐怕還為時尚早。
參考中國銀河證券的觀點,其認為有兩點原因不能忽略:
第一,ChatGPT與傳統搜索引擎的功能和優勢并不相同。
搜索引擎是幫助人們做信息檢索的,人們的檢索行為會返回多條查詢結果、準確率也較高,并且搜索引擎不會對信息做出判斷,完全呈現結果供用戶進一步篩選;
ChatGPT則是一個自然語言處理模型,用戶輸入單一指令,只能得到單一結果,以此來確保與用戶對話過程的流暢性。
第二,二者的應用領域不同。
搜索引擎的信息庫抓取信息快、信息庫更新頻率高、存量大,主要用于幫助用戶快速查找匹配信息、找到感興趣的信息,嘗嘗應用在文獻檢索、互聯網搜索等領域;
而ChatGPT的語料庫來源于離線數據,輸出的文本存在虛假信息的可能,且吸納新的知識需要對模型進行再訓練和微調,這會導致訓練成本和甄別成本上升,因此主要應用在人機對話、智能客服、智能問答等強邏輯性的自然語言交互領域。
除了這兩點原因之外,ChatGPT還面臨著信息老舊的問題。它并不會在網絡上抓取實時信息,知識僅限于2021年之前學到的東西。
基于以上幾點,短期之內,ChatGPT無法取代搜索引擎,但它可以作為當前搜索引擎服務的一種補充,也會對現有的搜索引擎公司產生一定的沖擊,促進巨頭間競爭。