界面新聞記者 | 崔鵬
7月4日下午,騰訊云正式發布AI原生(AI Native)向量數據庫Tencent Cloud VectorDB,該數據庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景。騰訊方面表示,它是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數據庫。
根據官方公開的數據信息,騰訊云向量數據庫最高支持10億級向量檢索規模,延遲控制在毫秒級;它相比傳統單機插件式數據庫檢索規模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。
“如果你看好AI大模型,就應該看好向量數據庫”,騰訊云數據庫副總經理羅云表示,隨著大模型的不斷發展和普及,AI Native向量數據庫將成為企業數據處理的標配。
向量數據庫通過把數據向量化然后進行存儲和查詢,能極大提升效率和降低成本。它能解決大模型預訓練成本高、沒有“長期記憶”、知識更新不足、提示詞工程復雜等問題,突破大模型在時間和空間上的限制,加速大模型落地行業場景。
騰訊官方的數據顯示,將騰訊云向量數據庫用于大模型預訓練數據的分類、去重和清洗相比傳統方式可以實現10倍效率的提升,如果將向量數據庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數量級。
羅云稱,騰訊云重新定義了AI Native的開發范式,提供了接入層、計算層、存儲層的全面AI化解決方案,使用戶在使用向量數據庫的全生命周期,都能應用到AI能力。
具體而言,在接入層,騰訊云向量數據庫支持自然語言文本的輸入,同時采用“標量+向量”的查詢方式,支持全內存索引;在計算層,AI Native開發范式能實現全量數據AI計算,一站解決企業在搭建私域知識庫時的文本切分(segment)、向量化(embedding)等難題;在存儲層,騰訊云向量數據庫支持數據智能存儲分布,讓企業存儲成本降低50%。
騰訊官方信息稱,使用騰訊云向量數據庫后,企業接入大模型需要花費的時間,能從一個月降低至三天左右,極大降低企業的接入成本。
對于產品的商業化問題,羅云表示,目前向量數據庫可以單獨對外提供,未來也不排除把向量數據庫和其它相關產品打包售賣的可能性。
在具體落地應用層面,騰訊方面表示,該向量數據庫基于騰訊每日處理千億次檢索的向量引擎(OLAMA),數據接入AI的效率比傳統方案提升10倍,運行穩定性達到99.99%,目前已經應用在騰訊視頻、QQ瀏覽器、QQ音樂等30多款騰訊內部產品之中。
以騰訊視頻的應用為例,視頻庫中的圖片、音頻、標題文本等內容使用騰訊云向量數據庫,月均完成的檢索和計算量高達200億次,能夠滿足版權保護、原創識別、相似性檢索等場景需求。
從使用結果來看,向量數據庫能直接提升運營效率。官方信息顯示,使用騰訊云向量數據庫后,QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低了37.9%。