文|三易生活
去年年末,聊天機器人ChatGPT如同一陣旋風般席卷全網。而“文能提筆做文章,武能動手修BUG”的ChatGPT,更是幾乎可以做任何事情,也使得AI文本生成仿佛第一次擁有了“靈魂”。得益于ChatGPT的優秀素質,在其上線短短5天后,Open AI首席執行官Sam Altman就在社交媒體披露其用戶量已突破100萬,也為AIGC再添了一把火。
作為Open AI背后的投資者,微軟方面似乎也看上了ChatGPT。近日來自海外科技媒體The Information的消息顯示,有知情人士透露,微軟方面正準備在其必應(Bing)搜索引擎中加入OpenAI的人工智能語言模型ChatGPT,以吸引競爭對手谷歌搜索的用戶。這也就意味著,ChatGPT對傳統搜索引擎的沖擊,或將從部分業內人士的推測變為現實。
這似乎也解釋了為何在ChatGPT快速走紅后,谷歌內部啟動“Red Code”的原因。針對ChatGPT,谷歌內部包括研發、安全和信任等多個部門的團隊被重新分配了工作任務,被要求協助開發新的AI技術原型和產品。沒錯,在搜索引擎會被ChatGPT取代這個問題上,谷歌也不復當初“ChatGPT還沒到能取代搜索引擎”的自信。
ChatGPT與傳統的搜索引擎有什么區別呢?事實上,通常意義上的搜索引擎,是指通過從互聯網上提取各網站的信息,將其保存在自己建立的數據庫中、并建立索引,用戶發起檢索請求后,系統檢索與用戶查詢條件匹配的相關記錄,然后按一定的排列順序將結果返回給用戶。在用戶檢索信息時,關鍵詞無疑是最為有效的手段。而在外界看來,奠定百度搜索引擎的基礎,無疑就是李彥宏的《超鏈文件檢索系統和方法》,其核心是以關鍵字作為核心權重來決定“目標頁面”的相關性和排序。
簡而言之,在搜索引擎中搜索信息的大體流程,是用戶輸入關鍵詞、搜索引擎在數據庫篩選匹配關鍵詞的結果,并為用戶排序出關聯度從高到低的鏈接。搜索引擎的本質,是基于用戶輸入內容向用戶“推薦”結果,但打開哪一個內容還是需要用戶自己來選擇。從二十年前的雅虎、谷歌,到世紀之交的百度,再到后來的搜狗、360、DuckDuckGo,也都沒有脫離這套運行模式。
對于用戶而言,這二十余年里在搜索框輸入關鍵詞,等待搜索引擎展示網頁鏈接,再根據自己的需求打開網頁,幾乎是一成不變的,或許這也是在日新月異的互聯網世界中,為數不多的古典氛圍了。然而這樣的體驗卻是有缺憾的,因為彼時的計算機還不能完美理解用戶的需求,所以需要用關鍵詞來讓計算機將用戶的需求,劃定在一個模糊的范圍內。
相信許多朋友在通過搜索引擎尋求問題的答案時,往往會在一個主題下嘗試不同的關鍵詞,這樣的效果顯然稱不上完美。而在滿足用戶信息需求方面,ChatGPT則提供了一個完全不同的體驗,面對用戶需求ChatGPT是直接給出答案,避免了用戶的選擇,并實現了從搜索問題到生產答案的一步到位式體驗。
雖然對于部分用戶來說,更希望將選擇權握在自己手里,但抖音、TikTok在全球范圍內的成功,已經證明了絕大多數用戶是“懶惰”的。準確來說,大多數用戶希望借助推薦算法來幫助自己檢索、并篩選信息,并不反感互聯網廠商為他們營造一個“信息繭房”。相比傳統搜索引擎有輸入、檢索、整理、結果這四步,ChatGPT則直接跳過了中間的兩個步驟,實現了從輸入到結果這個新的搜索方式。
而谷歌對ChatGPT極為警惕的背后,其實是用戶對于搜索引擎的期望就是即時滿足信息需要,而這也是ChatGPT的核心優勢。事實上,ChatGPT是OpenAI在2020年推出的自然語言識別模型GPT-3的衍生產品,并以從人類反饋中強化學習的方法訓練這一模型,基于GANs(生成對抗網絡)讓ChatGPT在不斷的調試、迭代中,生成與真實數據無二的結果。
其實ChatGPT并不能理解用戶提問的意圖,也不理解人類語言中的邏輯,只是對1750億個訓練文本中字詞組合的出現率進行了統計,再按照用戶輸入的內容和統計出來的出現率排列字詞,來給出看起來合理的回復。而“一本正經的胡說八道”,在ChatGPT上是十分常見的一件事。
如此龐大的數據自然能讓ChatGPT變得“無所不能”,其實從本質上來說,ChatGPT之所以顯得如此聰明,關鍵在于Open AI斥資1200萬美元為其訓練成本買單,它的底層運行邏輯依舊還是“基于統計的拼湊”。
ChatGPT其實并不像許多人渲染的那般智能,它同樣需要基于輸入的數據集來進行訓練,這也是為什么最開始谷歌對于ChatGPT并不重視。原因其實也很簡單,ChatGPT的成功靠的是Open AI比友商更愿意支付訓練大型人工智能模型的成本。然而一旦ChatGPT與微軟的Bing攜手,情況就會發生變化。
ChatGPT在NLP(自然語言處理)上的能力,確實要比以往的文本生產AI有著大幅度的升級,這也確保了它不會出現答非所問的問題,而微軟Bing搜索引擎的加入也將會為其解決最大的難題,那就是數據集。傳統搜索引擎擅長的收集海量信息,搭配ChatGPT從人類行為中學習的能力,必然就會迸發出1+1>2的效果。
當然,Bing與ChatGPT的合作也有一個問題,那就是如何篩選出有價值的內容來“喂養”ChatGPT。要知道直到目前為止,數據的標記和篩選工作中,人工的比例都相當高,如果微軟或Open AI能夠將數據標記和篩選的過程完全自動化,或許通用搜索引擎的時代就真的要落幕了。