文|烏鴉智能說
據多家外媒近日報道,知情人士透露稱,OpenAI正秘密研發一款新的搜索引擎,可能叫SearchGPT或Sonic,目標是挑戰Google的搜索霸權。
“OpenAI即將向谷歌搜索發起挑戰,這是谷歌迄今為止面臨的最嚴重威脅。”前 Mila 研究員、麻省理工講師Lior S在X平臺上爆料稱。
據X用戶名為Jimmy Apples的人工智能領域的知名爆料者預測,OpenAI將在5月9日發布新產品。而值得注意的是,谷歌I/O開發者大會將于5月14日召開。也就是說,OpenAI將搶在這場盛會之前發布搜索產品,大有“先發制人”之意。
有趣的是,當OpenAI搜索即將上線消息傳出,谷歌的股價沒有絲毫變化。這與一年前ChatGPT橫空出世,眾人大呼敲響搜索的喪鐘形成了天然之別。
為什么OpenAI會盯上谷歌這塊“蛋糕”?我們又該如何看待谷歌搜索業務的前景呢?
/ 01 / 盯上搜索“蛋糕”
從定義上看,搜索本質是聯合整合信息的能力,AI搜索更進一步,不用用戶挨個點開鏈接了,直接給你答案,相當于升級版的搜索。根據業內人士透露,有超過一半用戶在百度里輸入長句子,甚至最后還帶問號。
這意味著,搜索幾乎是AI應用最成熟的場景。Perplexity持續的流量增長就是最好的證明。在a16z 最新發布的月訪問量前 50 的 GenAI 產品中,PerplexityAI 排名高居第七。根據Similarweb數據,Perplexity今年前三月的流量分別為4560萬、4954萬和6149萬。
盡管用戶體量依然差谷歌幾個量級,但Perplexity仍然在一個Google長期霸占的市場利用AI獲得了階段性顛覆成果。
在這樣的成績面前,Perplexity也水漲船高。2024 年 1 月,Perplexity 籌集了近 7400 萬美元,估值達到 5.4 億美元,3 月初,Perplexity 以 10 億美元的估值完成了 5600 萬美元的融資。根據 TechCrunch 最新報道,Perplexity 正在籌集至少 2.5 億美元資金融資,最新估值在 25~30 億美元之間。
在國內也一樣。AI搜索秘塔是僅次于文心一言和Kimi的第三大AI應用產品。今年3月,秘塔的月訪問量為721萬,增長了551%。
對于OpenAI來說,高昂的估值和龐大的研發開支,迫使其需要尋求更大的商業化突破。
一方面,ChatGPT的流量和商業化遭遇了階段性瓶頸。SimilarWeb網站數據顯示,在經歷了2023年初的爆炸式增長之后,ChatGPT 自2023年6月全球流量下降了9.7%,流量逐月起伏。
2024年2月,隨著GPT store和Sora的發布雖有所回升,但全球流量環比僅增長1%,訪問量為 16 億次,還沒有完全恢復到2023年5月達到的峰值。受限于月活起伏,ChatGPT付費用戶規模也不到1000萬。
縱觀與AI匹配大規模商業化場景里,OpenAI 的選擇其實并不多,其很難跟微軟去搶 ToB 的市場,也很難跟英偉達去搶芯片的市場,更難跟 Apple 去搶終端市場。放眼望去,谷歌手上的搜索是OpenAI為數不多的可行選擇。
既有Perplexity的珠玉在前,AI搜索的商業化想象力也足夠大。2023年,谷歌的搜索廣告機創造了超過1750億美元的收入,廣告總收入占谷歌2023 年總收入的近 78%。即使在國內,被認為“沒落”的百度靠著搜索一年也能賺1000億。
/ 02 / 大模型與搜索有何不同?
在很多人看來,Perplexity和大模型好像沒什么太大區別。ChatGPT本身就能直接解答用戶的提問,NewBing 也是默認搜索加整合答案。這樣看來,OpenAI下場做搜索自然輕而易舉。
但其實并非如此。以AI搜索Perplexity為例,大模型和Perplexity的區別就是,一個能用、一個好用。大模型本身能搜索不假,但也會出現很多問題。
比方說,生成式AI無法做到實時更新,且受限于訓練數據,可能無法覆蓋相對小眾、缺乏通用性的長尾知識。同時,生成式AI對生成內容的可控性較差,存在“幻覺”問題,用戶也難以對答案進行直接驗證。
Perplexity所做的事情就是,把這些大模型搜索過程中出現的“坑”一個個都填掉,其中最重要的事情就是信息的實時性和準確性。
實時性方面,與ChatGPT等大模型依賴訓練時的數據和語料獲取信息不同,Perplexity基于底層傳統搜索引擎開發而得,能夠及時抓取最新的信息。
準確性方面,Perplexity做了兩件事情:減輕幻覺和內容溯源。為了減少幻覺現象,Perplexity引入了RAG技術(檢索增強生成),RAG的作用好比是給模型提供一本教科書,讓它根據特定的問題去查找信息,通過關聯外部知識來提高答案的準確性,有效減少了語言模型中出現的虛假信息,使得生成的回答更準確可信。
與此同時,Perplexity還對生成的每一句話都附有引用鏈接,在保證可靠性的同時便于用戶溯源或深入研究。
不僅如此,Perplexity還對召回和排序環節的算法做了創新,保證內容的有用性及引用的精確程度。其中,“召回”指根據搜索指令從數據庫中獲取盡可能多的正確結果,“排序”指根據用戶搜索內容的相關性對召回結果進行排序,決定了搜索引擎的精確程度和性能上限。
這也讓Perplexity成為當下綜合性能最好的AI搜索引擎。在2023年4月的論文中,斯坦福的研究人員對YouChat、Perplexity.AI、NeevaAI及BingChat四個生成式搜索引擎進行了人工評估。結果顯示,Perplexity.ai生成內容有用性的評分為4.56分,排名第二;引文召回率和精確度為68.7,排名第一;在泛搜索引擎類的體驗中,綜合能力位于最前列。
除了在信息準確、可靠上,Perplexity在響應速度上也花了很多功夫。比如,Perplexity通過自研推理堆棧,讓其內容生成速度快于GPT類通用模型。在模型側,公司對GPT-3.5進行微調,在降低成本的同時進一步提升響應速度。
Perplexity的成功,也證明了一件事情:比起模型能力,產品本身單點的價值創造和體驗的優化,是一個更為重要的事情。這意味著,即使是擁有先進大模型的OpenAI,想要提供更好的用戶搜索體驗,上述產品層面的優化一樣也少不了。
不過相比Perplexity等產品公司做模型,模型公司做產品的難度要小得多。
/ 03 / 谷歌基本盤穩固,但隱憂不小
去年年初,ChatGPT的爆火,很多人斷言,ChatGPT的出現幾乎就等于敲響搜索的喪鐘。按前谷歌第23位員工、Gmail的創建者之一Paul Buchheit的說法,像ChatGPT這樣的人工智能聊天機器人將摧毀谷歌,就像當年搜索引擎徹底干掉黃頁電話簿一樣。
2023 年 2 月,微軟宣布將推出由 OpenAI 的 GPT 技術提供支持的新版 Bing 搜索引擎,以追逐谷歌的搜索主導地位。當時,微軟表示,僅1%的搜索廣告市場份額就價值 20 億美元的年收入。
但是,一年時間過去了,谷歌基本盤依然穩固。StatCounter 的數據顯示,微軟的搜索引擎在 2024 年 1 月的市場份額僅為 3.43%,比去年同期增長不到 1%。與此同時,谷歌的市場占有率為 91.46%,相比去年僅下降了不到 1%。
去年以來,谷歌的搜索廣告收入逐季提升。到了今年一季度,搜索廣告同比增長14%,甚至高于市場預期。
在產品層面,去年谷歌也推出了搜索生成體驗 (SGE),使用人工智能來生成復雜問題的上下文答案。看上去,谷歌似乎逐漸找到了用戶體驗到商業化之間的平衡。可以說,Bing的挑戰失敗了。
所以,當OpenAI的搜索即將上線,谷歌的股價也沒有絲毫變化。也就是說,市場并沒有給這個事件的影響給予充分的定價。
但客觀來說,不同于Perplexity,OpenAI的潛在威脅可要大得多。一方面,OpenAI天然擁有龐大的用戶池,ChatGPT手上有十幾億的用戶規模,日活在5000萬左右。另一方面,OpenAI自身擁有模型,且性能更加先進。一旦agent最后成為AI時代大一統的終極產品,擁有更先進模型的OpenAI,將會給谷歌造成更大的麻煩。
換句話說,比起Perplexity,顯然OpenA更有可能給谷歌搜索業務帶來沖擊。尤瓦爾·赫拉利在《人類簡史》中寫過這樣的一句話:歷史的鐵律就是,事后看來無可避免的事,在當時看來總是毫不明顯。