界面新聞記者 | 彭新
進入7月,AI大模型開始不斷落地,主要云廠商紛紛推出結(jié)合大模型的產(chǎn)品方案,并展示了商業(yè)化能力:微軟將AI語言大模型嵌入Office辦公套件的Office Copilot,可創(chuàng)作、編輯和分析,并給出30美元/每月高定價;谷歌AI聊天機器人Bard升級支持更多語言,叫板ChatGPT同時,還將改變其核心搜索廣告業(yè)務模式。
作為全球排名第一的云廠商,外界頗為關注亞馬遜云科技(AWS)如何應對新一輪AI變革,挑戰(zhàn)OpenAI等公司在人工智能市場上的地位。
有聲音認為,相較其他云廠商,亞馬遜云科技似乎顯得“保守”:一方面其生成式AI產(chǎn)品開放程度有限,企業(yè)客戶難以充分評估;另一方面,少有企業(yè)領域“標桿客戶”對其AI服務進行推薦,使得亞馬遜云科技在本輪AI競賽中聲量遠遜于對手。
但亞馬遜內(nèi)部并不認為這一外部觀察體現(xiàn)出其在AIGC領域的全貌。亞馬遜云科技首席執(zhí)行官Adam Selipsky認為,生成式AI目前處于非常早期的階段,就像十公里比賽剛跑出幾步,談論勝負為時尚早。他舉例稱,1997年PC互聯(lián)網(wǎng)正蓬勃發(fā)展時,主導市場的搜索公司名為AltaVista,然而如今的年輕人可能對這個公司已經(jīng)不太熟悉了,“一場10公里的比賽,不能剛跑出幾步就下結(jié)論誰將在比賽中領先。”
AI對于亞馬遜來說并不新鮮。一直以來,亞馬遜電商部門借助AI技術推薦、銷售和配送產(chǎn)品,其云計算服務是實現(xiàn)云端安全、數(shù)據(jù)庫、數(shù)據(jù)中心運營維護的基礎,同時向企業(yè)客戶提供AI服務。亞馬遜云科技2017年推出的機器學習服務Amazon SageMaker,是行業(yè)主要的機器學習平臺。

這一做法在過去頗為成功,如在制造領域,工業(yè)軟件巨頭歐特克使用Amazon SageMaker構(gòu)建設計工具,在飛機制造中實現(xiàn)名為“衍生式設計”的新設計方案,該方案通常比人工設計方案更堅固、輕巧。歐特克曾向界面新聞介紹,基于衍生式設計,設計出的飛機航壁重量比傳統(tǒng)零件輕了45%,但強度相當,保持了安全性。如果將這種航壁推廣應用到全球飛機機隊,將可以節(jié)省約相當于93000輛汽車油耗的燃油。
盡管如此,AI領域已發(fā)生了翻天覆地的變化,像ChatGPT這樣的在線聊天服務成為一大轉(zhuǎn)折點。這背后的核心是“大語言模型(LLM)”,許多技術專家認為這些模型標志著新型平臺誕生,AI將變成一個技術層,在其之上可以構(gòu)建各種軟件服務。
很多人把大語言模型和互聯(lián)網(wǎng)、智能手機和云計算的出現(xiàn)相比較,亞馬遜云科技也希望從這一熱潮中分得一杯羹。Adam Selipsky稱,模型的選擇與靈活性、企業(yè)級安全與隱私保護、數(shù)據(jù)戰(zhàn)略是生成式AI的三大基石,并為此提供了相應的解決方案,首先要給客戶提供選擇和靈活性,未來不會是一個大模型主宰一切。
目前亞馬遜也在出售一系列AI工具服務,包括幫助訓練復雜模型的服務、無需編寫大量代碼便能使用AI的軟件等等。4月,其發(fā)布了自研大模型Titan,包括Text和Embeddings兩個大模型,分別負責文字處理和用于機器學習的表征向量轉(zhuǎn)化,但亞馬遜并未公布這兩個大語言模型得參數(shù)規(guī)模。AI云服務Amazon Bedrock可讓用戶通過API來調(diào)用Titan和第三方模型,包括創(chuàng)業(yè)公司AI21 Labs、Anthropic和Stability Ai的基礎模型。
不同于OpenAI與谷歌的閉源大模型,亞馬遜云科技是開源大模型的主要云服務平臺支持者。7月19日,Meta發(fā)布開源免費可商用大模型Llama 2,據(jù)稱在預訓練語料庫、訓練所用的字符文本單元(token)等方面均有升級,其700億級模型的性能表現(xiàn)更加接近GPT-3.5,但與GPT-4的性能相比仍存在較大差距。同日,亞馬遜云科技宣布Llama 2可在其云平臺獲取。
此外,亞馬遜還宣布全面開放AI代碼輔助工具CodeWhisperer,對個人開發(fā)者免費。該工具支持主要計算機語言。亞馬遜稱,使用該服務的開發(fā)者效率可提高57%,成功完成任務的可能性提升了27%。同時,CodeWhisperer引用了跟蹤器功能,在為開發(fā)者提供代碼選項時,會告知代碼源和許可證信息,以免開發(fā)者使用可能侵權的代碼。
Adam Selipsky提到,不少企業(yè)對生成式AI仍有顧慮,一些CIO在企業(yè)內(nèi)禁止使用ChatGPT,原因是擔心用自己企業(yè)的數(shù)據(jù)優(yōu)化GPT模型,為競爭對手作嫁衣。今年5月,三星便發(fā)現(xiàn)有員工把敏感代碼上傳到了ChatGPT上。也有企業(yè)擔憂,這些敏感信息可能被存儲在外部云端服務器上,像蘋果和摩根大通等公司已禁止或限制使用ChatGPT。
贏得客戶的信任并不容易。為此,Adam Selipsky稱Amazon Bedrock可以讓企業(yè)在確保數(shù)據(jù)安全和隱私保護的前提下,使用自有數(shù)據(jù)建立基礎模型,對模型定制調(diào)優(yōu)。Amazon Bedrock不會讓定制所用的客戶數(shù)據(jù)用于訓練基礎模型。同時,所有數(shù)據(jù)都進行了加密,且不會離開客戶的虛擬私有網(wǎng)絡(VPC)。
不過,即使企業(yè)對生成式AI頗感興趣,實現(xiàn)起來也不容易。亞馬遜云科技發(fā)現(xiàn),有相當數(shù)量的中國企業(yè)希望導入生成式AI的同時,業(yè)務數(shù)據(jù)遠未達到要求,導致難以訓練自有大模型,因此需要從數(shù)據(jù)底層積累做起。Adam Selipsky強調(diào),數(shù)據(jù)是人工智能的核心,云在數(shù)據(jù)治理、存儲和計算方面的能力,可以為生成式AI提供幫助。