文|讀懂財經
曾經,很多人以為,ChatGPT的橫空出世,就幾乎等于敲響搜索的喪鐘。
這樣的說法在當時不在少數。按前谷歌第23位員工、Gmail的創建者之一Paul Buchheit的說法,ChatGPT將摧毀谷歌,就像當年搜索引擎徹底干掉黃頁電話簿一樣。
一年時間過去了,AI大模型替代搜索的進程,遠沒有大家想象的那般順利。但一切并非毫無意義。隨著Perplexity等AI搜索產品的涌現,也讓我們對AI給搜索行業帶來的變化有了更加清晰的認識:
首先,與傳統搜索引擎相比,AI搜索讓信息的顆粒度從網頁細化到信息本身,進而提升了信息獲取的效率。這是AI搜索最大的價值。
其次,作為一款AI套殼產品,像Perplexity等產品的成功在于,實現了單點的價值創造和體驗優化,更是一次AI工程化層面的勝利。
第三,像Perplexity這樣的AI搜索,目前更多集中在知識等小眾領域,距離替代谷歌成為通用搜索引擎仍然有很長的距離要走。
盡管當下AI搜索替代谷歌幾無可能,但長期并非毫無可能。從過去科技的演進看,新技術對老技術的替代,往往是以意想不到的顛覆形式完成的。正如誰能想到如今擁有上億用戶的快手,當初只是一個做GIF的工具。變化與未知,就是新技術的魅力。
01 比搜索更精準是如何做到的?
在AI搜索的賽道,Perplexity 是絕對的明星。公司創始人Aravind Srinivas來自OpenAI,2022 年 8 月創立了 Perplexity。2023年10月,公司完成了新一輪融資,估值達到 5 億美元。
與其說,Perplexity是一個搜索引擎,倒不如說是答案引擎。當用戶向Perplexity輸入問題并點擊搜索后,你能得到一個回答。比如,當你向Perplexity提問“蠟筆小新是誰”,會得到Perplexity的相應回答。
這個答案是通過網上已有的信息總結提煉而來。在回答欄目的上方,Perplexity還會給出參考內容的來源,并支持點擊。在回答的下方,Perplexity預測了幾個用戶可能會追問的問題,點擊后頁面繼續向下展開對于該問題的答案,用戶也可以自行進行提問。
此外,在回答欄目的側邊,用戶還可以搜索相關主題的圖片和視頻。
Perplexity不僅能夠回答簡單問題,還能理解用戶一些比較復雜的問題,比如當用戶就“生成式AI與過去的AI相比有哪些不同和特點”進行提問時,Perplexity也能進行回答。
但不足的地方是,在“生成式AI與過去的AI相比有哪些不同和特點”問題來說,Perplexity推薦的視頻和主題關系并不大。也就是說,在復雜問題從文字向更多模態轉化過程中,搜索內容的效率有比較大的下降。
看上去,AI搜索更像是傳統搜索引擎的一次升級,即從過去的單邊的信息查詢和SEO策略優化,轉變成雙邊的信息交互。
過去的傳統搜索引擎的工作流程是,基于用戶搜索的內容,對相關內容進行索引并創建搜索索引,所謂的索引,可以理解為內容過濾后,一個與搜索內容有關,且包含頁面及其內容和排名信息的數據庫。然后再對索引中的頁面使用各種算法進行排名,進而給出搜索結果。
相比之下,Perplexity比搜索引擎額外多做了幾件事。在搜索前,Perplexity會通過大模型,重新理解用戶提出的問題,然后解析為一個更清晰的搜索指令。接下來,調用Google、Bing等搜索引擎的API創建相應的索引庫,然后用自有的排序算法,對所有的搜索結果做重新排序,篩選出數量不等且高質量的網頁。最后,讓大模型閱讀篩選出來的內容并輸出和問題相關的答案,以及可能用到的問題。
也就是說,相比搜索引擎做的是信息相關度的匹配,而Perplexity是在此基礎上做了更多理解指令上的工作,進而讓搜索結果更接近用戶想要的東西。
搜索效率升級的背后,是搜索顆粒度的細化。在互聯網時代,搜索引擎將信息以網頁為最小粒度為用戶進行排序和推薦。而大模型能夠學習所有 Google上能得到的信息,并將知識以詞匯為最小粒度生成相應的內容。
02 Perplexity破局的啟示
聽起來,Perplexity所做的事情很簡單,就是在原有搜索引擎基礎上加入了大模型的自然語言理解和生成豐富回答能力。那么,是不是意味著所有大模型企業也可以做?
其實并非如此。曾經在很多人看來,生成式 AI 可能會取代傳統搜索引擎,但用大模型直接進行搜索也會出現很多問題。
比方說,生成式AI無法做到實時更新,且受限于訓練數據,可能無法覆蓋相對小眾、缺乏通用性的長尾知識。同時,生成式AI對生成內容的可控性較差,存在“幻覺”問題,用戶也難以對答案進行直接驗證。
Perplexity所做的事情就是,把這些大模型搜索過程中出現的“坑”一個個都填掉,其中最重要的事情就是信息的實時性和準確性。
實時性方面,與ChatGPT等大模型依賴訓練時的數據和語料獲取信息不同,Perplexity基于底層傳統搜索引擎開發而得,能夠及時抓取最新的信息。
準確性方面,Perplexity做了兩件事情:減輕幻覺和內容溯源。為了減少幻覺現象,Perplexity引入了RAG技術(檢索增強生成),RAG的作用好比是給模型提供一本教科書,讓它根據特定的問題去查找信息,通過關聯外部知識來提高答案的準確性,有效減少了語言模型中出現的虛假信息,使得生成的回答更準確可信。
與此同時,Perplexity還對生成的每一句話都附有引用鏈接,在保證可靠性的同時便于用戶溯源或深入研究。
不僅如此,Perplexity還對召回和排序環節的算法做了創新,保證內容的有用性及引用的精確程度。其中,“召回”指根據搜索指令從數據庫中獲取盡可能多的正確結果,“排序”指根據用戶搜索內容的相關性對召回結果進行排序,決定了搜索引擎的精確程度和性能上限。
來源:中金研究部
這也讓Perplexity成為當下綜合性能最好的AI搜索引擎。在2023年4月的論文中,斯坦福的研究人員對YouChat、Perplexity.AI、NeevaAI及BingChat四個生成式搜索引擎進行了人工評估。結果顯示,Perplexity.ai生成內容有用性的評分為4.56分,排名第二;引文召回率和精確度為68.7,排名第一;在泛搜索引擎類的體驗中,綜合能力位于最前列。
除了在信息準確、可靠上,Perplexity在響應速度上也花了很多功夫。比如,Perplexity通過自研推理堆棧,讓其內容生成速度快于GPT類通用模型。在模型側,公司對GPT-3.5進行微調,在降低成本的同時進一步提升響應速度。
Perplexity的成功,也給了那些苦苦探索AI大模型落地的創業者一些啟示:比起模型能力,產品本身單點的價值創造和體驗的優化,是一個更為重要的事情。
03 替代谷歌言之過早
從數據上看,自產品發布以來,Perplexity的成績著實不錯。
根據Similar Web數據,截至2023年10月25日,Perplexity APP的日度下載量為14,163次;2023年2月1日至10月25日,Perplexity網頁端的周度訪問量由275萬增加至1,113萬,增長3倍,與同類別的AI搜索應用YouChat相比增長勢頭強勁。
盡管Perplexity的表現足夠優秀,但距離真正替代谷歌等傳統搜索引擎還有很長的距離。從定位上看,當下的Perplexity更像一個知識平臺,用戶對其需求大都集中在知識領域,定位類似于AI時代的Wikipedia 和 Quora。
從Perplexity后續的更新動作上,也不難看出這一點。比如,Perplexity正在嘗試以知識分享為核心,創建相關的內容社群生態,Perplexity支持用戶將搜索問題及答案分享至社區,供其他用戶學習討論。
之所以Perplexity選擇以知識平臺為切入點,主要基于兩點考慮:
一是RAG技術更擅長在開放域知識問答及生成式問答中發揮作用。Meta的技術論文對RAG技術進行了詳細測評,包括開放域問答、開放域問題生成、抽取式問答及分類推理任務。在開放域問答中,RAG-Token和RAG-Seq得分處于領先地位;在生成任務和分類任務中,RAG表現優于BART模型。
二是谷歌在消費、地圖上積累了大量的數據,這讓Perplexity在生活/購物等更高頻的場景沒有任何優勢,很難實現場景的泛化。
以知識平臺為目標,固然讓Perplexity找到了差異化的方向。但同時也意味著,Perplexity短期內很難成為一款低門檻的大眾化互聯網產品,至于替代谷歌更是無從談起。
不僅如此,與大多數AI創業公司一樣,Perplexity并沒有形成可持續的商業模式。目前,Perplexity的變現方式主要有兩個:會員訂閱和API調用,但尚未形成規模化收入。
雖然收入沒起來,但支出卻一點都不少。根據中金測算,目前Perplexity調用Bing搜索引擎及GPT-4的單個問題成本約為0.03美元,年成本約為6000萬美元,這還不包括后續Perplexity自研模型所產生的成本。
從過去看,搜索向來是個馬太效應極其明顯的市場。盡管用戶對百度詬病頗多,也不影響百度在中國搜索引擎的市占率超過7成。如果用當下的視角理解產品技術演進的結果,Perplexity似乎沒有任何機會。
但這事好就好在,新技術對老技術的替代,往往是以顛覆的形式出現的,甚至老玩家固有的“習慣”還會成為其迭代的最大障礙。就拿搜索這事來說,AI搜索直接給出關鍵信息的交互方向,天然與谷歌現有競價排名的商業模式相背離。
如何取舍對谷歌來說是一個難題,而對Perplexity來說則是一個機會。從這個角度來說,Perplexity替代谷歌固然言之過早,但也未必沒有可能。