文|硅兔賽跑
這個月初,號稱「人類首個AI軟件工程師」的Devin火爆出圈,給世界帶來了億點點震撼。
它掌握全棧技能,云端部署、底層代碼、改bug、訓練和微調AI模型,一經發布就掀起業內瘋狂討論,甚至有人說:軟件工程師要失業了。
圖源:DigiAlps LTD
開發Devin的初創公司Cognition AI,僅由10人團隊組成,團隊雖小,全是大牛。大多是華人面孔的隊伍,狂攬10 枚IOI(國際信息學奧林匹克競賽)金牌,還有人在DeepMind、Waymo 等大廠的工作經歷。
Cognition AI成立才不到兩個月就獲得硅谷投資大佬Peter Thiel的Founders Fund基金領投的2100萬美元A輪融資,以及Google高管Elad Gil、計算機科學家Christopher Re、Strip創始人John Collison的聯合支持。
01 一個,和無數個
雖然Devin才上線兩周,且沒有完全對外開放使用,拿到早期測試資格的人和公司并不多,不過還是有不少工程師曬出實測結果。
只需要自然語言寫的提示詞,接下來的所有工作都可以交給Devin,它會像一個真正的程序員一樣完成工作。
碼農的世界已然變了天。Devin的首席執行官Scott Wu還在社交媒體發出現在的Devin還成為Cognition AI的首席執行官替身,開始打工了。
最近幾天,AI初創公司Suno AI推出了第一款可制作的音樂生成模型V3,音樂圈炸裂。
圖源:MLWires
此前,Suno AI因爆改的周杰倫的《以父之名》和《夜曲》出圈,當時網友紛紛驚嘆未來AI音樂的可能性。本周發布的V3,僅用幾秒的時間,便可以創作出2分鐘的完整歌曲。
Air Street Capital預測,今年會有AI生成的歌曲成為 Billboard 或 Spotify 熱門單曲。
今年Y Combinator W24即將在四月如期來到,我們觀察到這個batch里同樣有不少AI to software的初創公司。
Pythagora是一款開發工具,由 GPT Pilot 和GPT-4支持的 VS Code 擴展,它能通過與用戶對話,從零開始構建應用程序。非常適用于使用 Node、Express 和 MongoDB 的網絡應用程序項目。
Pythagora在Github上有2.43萬星,由CEO Zvonimir &CPO Leon 聯合創立。AWW app (1.5M MAU 2016-2021) 被 Miro 收購;CTO Senko與 CEO Zvonimir一起開發了一個開源的軟件自動測試項目,后來轉型到 GPT Pilot 上。
圖源:Linkedln
Fume是一款人工智能軟件開發工具,用戶可以在開發周期的任何階段隨時隨地訪問,它類似一個編碼助,但更像是一個團隊成員,你可以從它那里獲得幫助也可以將工作完全委托給它。
每個開發團隊都有一長串未處理的錯誤報告、生產錯誤日志和功能請求,有些任務其實無聊又繁瑣,修復他們往往花費了工程師大量的寶貴時間。Fume的用戶只需在 Slack、VSCode、Github 或其他任何地方發出一個提示,即可在整個代碼庫中更改多個文件。
圖源:Fume
Marblism,一款通過單個提示生成功能齊全的 Web 的應用程序。創始人認為每個人都害怕前幾行代碼:選擇框架、設計 UI/UX、設置項目、集成前端與后端,用戶只需要描述您想要構建的產品,接下來90%的基本網站構建工作都可以放手交給Marblism,只需專注于剩下的個性化內容即可。
Marblism是兩位聯合創始人的第二次創業,上一家公司Vauban于2022年被Carta收購。
圖源:Marblism
02 自己卷自己
除了AI+軟件的初創,這屆YC出現了很多相同類型產品的不同公司,比如視頻生成領域。
Magic Hour是一款視頻生成工具,由兩個年輕的華人工程師創立,其中聯合創始人兼CEO曾是Meta的高級數據科學家,CTO也有相當長的行業經驗。
Magic Hour使用開源模型,支持AI換臉、視頻to視頻、文字to視頻、圖像to視頻等形式,區別于寫實風格的視頻,Magic Hour生成的視頻主要以動畫風格為主。
圖源:Magic Hour
同樣是AI+視頻,Yarn旨在利用人工智能,幫助客戶制作專業品質的產品和銷售視頻。銷售團隊可以使用 Yarn 制作銷售資料、發布視頻、用例演示、培訓指南,YC里的的一些公司比如DriverAI (W24) 、Replo (S23) 、Forge (W24) 已經在嘗試使用Yarn。
同類型的成熟產品有Loom AI,去年10 月份宣布以 9.75 億美元被協作軟件巨頭 Atlassian收購。
圖源:Yarn
Infinity AI號稱只需上傳文字劇本,就可以將其制作成電影。由MIT校友組成的創始團隊稱在未來十年內,由三名編劇組成的團隊會贏得奧斯卡金像獎。
不過,從demo上看生成的效果還不夠成熟,目前只能生成半身人像視頻,且人臉的面目比較僵硬,達到所謂“電影級別的效果”還言之過早。
圖源:Infinity AI
「AI+視頻」是本屆YC一個擁擠賽道,同在擠在同類型產品中競爭的還有「AI+語音/音樂」,至少有十多個項目。
VoicePanel是一個用于定性研究的全自動平臺,負責招募高質量的參與者并對他們進行訪談,將反饋綜合成有價值的報告。
兩位創始人都是哈佛大學計算機工程畢業,CEO John曾在Google有著十多年工作經驗,后加入Optimizely并結識CTO Asa,后者曾在Microsoft工作,曾創立了 Level (YC S21)被 英國出租代理服務公司Vouch 收購。
圖源:VoicePanel
Retell AI由五位華人創立,幫助開發人員在短時間內制作類人語音代理。實際上語音人工智能已經出現了一段時間,但始終沒有被主流廣泛應用。主要原因是用戶體驗不佳,表現為AI對話流程常常因不自然的停頓和中斷,人類的請求經常被誤解,生成的聲音聽起來機械化等等。
Retell AI生成的類人語音AI代理已經實現了平均 800 毫秒的響應時間,達到了人類交互的水平。在團隊展示的Demo中,AI代理相應迅速、聲音真實、理解迅速并且在被打斷時也能做出正確響應。
圖源:Retell AI
Soundry AI為音樂家和聲音設計師構建了一個通用的文本到聲音人工智能生成器。三位聯合創始人都因對音樂的熱愛而團結在一起,其中CEO Mark在康奈爾大學獲得人工智能博士學位,另一家創業公司也是音樂相關。
用戶可以使用Soundry AI創建獨特、高質量、無版權的demo,目前的展示來看,效果相比同類產品更為優秀。
圖源:Soundry AI