女性一般几天一次性需要,无码人妻丰满熟妇片毛片,性欧美大战久久久久久久久

文|三易生活

如今，人工智能毫無(wú)疑問(wèn)已經(jīng)是科技行業(yè)最為熱門的賽道之一，甚至幾乎所有叫得上名號(hào)的科技企業(yè)都卷入了這場(chǎng)競(jìng)賽。而在AI大模型的相關(guān)市場(chǎng)競(jìng)爭(zhēng)中，除了底層的算法、架構(gòu)外，“語(yǔ)料”則是一個(gè)被反復(fù)提及的關(guān)鍵要素。但圍繞“語(yǔ)料”這一AI大模型的生產(chǎn)資料，在過(guò)去一年間，整合行業(yè)也上演了一系列光怪陸離的故事。

那么訓(xùn)練AI大模型的語(yǔ)料從何而來(lái)呢？自然是從書(shū)籍、報(bào)刊、雜志、視頻、音頻、代碼等，一系列凝聚了人類智慧的產(chǎn)物中來(lái)，但是由于AI不是人類，他們認(rèn)識(shí)世界的方式與人類不同，所以蘊(yùn)含在這些作品中的信息還需要經(jīng)過(guò)一道處理工序，才能轉(zhuǎn)化為可以被AI大模型利用的語(yǔ)料，而這就是所謂的“數(shù)據(jù)標(biāo)注”了。

比如OpenAI旗下的ChatGPT，就是靠著2美元時(shí)薪的海外外包數(shù)據(jù)清洗人員，完成了史無(wú)前例的1750億參數(shù)量、45TB的訓(xùn)練數(shù)據(jù)。

如果把人工智能比作一棟大樓，那么標(biāo)注的數(shù)據(jù)就是一塊塊的磚，如果將人工智能比作一碗飯，那么標(biāo)注的數(shù)據(jù)自然也就是大米了。從某種意義上來(lái)說(shuō)，現(xiàn)階段的人工智能在實(shí)質(zhì)上其實(shí)就是字面上的意義，也就是50%的人工+50%的智能。如果沒(méi)有人工數(shù)據(jù)標(biāo)注的存在，那么當(dāng)下的AI大模型競(jìng)爭(zhēng)恐怕是要直接“熄火”。

有鑒于此，谷歌方面近期表示要讓人工智能更智能一些。

日前，Google Research的最新研究提出了AI反饋強(qiáng)化學(xué)習(xí)（RLAIF），用來(lái)代替基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF）。事實(shí)上，RLHF正是ChatGPT等同類產(chǎn)品表現(xiàn)出比Siri等上一代人工智能產(chǎn)品更聰明，表達(dá)更接近人類的關(guān)鍵驅(qū)動(dòng)因素之一，它可以借助人類反饋信號(hào)來(lái)直接優(yōu)化語(yǔ)言模型，數(shù)據(jù)標(biāo)注人員則通過(guò)給大模型產(chǎn)出的結(jié)果打分，由他們來(lái)負(fù)責(zé)判斷大模型生成的文本是否優(yōu)質(zhì)（迎合人類偏好）。

根據(jù)谷歌方面的研究結(jié)果顯示，RLAIF可以在不依賴人類標(biāo)注員的情況下，產(chǎn)生與RLHF相當(dāng)?shù)母倪M(jìn)效果。具體來(lái)說(shuō)，當(dāng)被要求直接比較RLAIF與RLHF的結(jié)果時(shí)，人類對(duì)兩者的偏好大致相同，同時(shí)RLAIF和RLHF都優(yōu)于傳統(tǒng)的監(jiān)督微調(diào)（SFT）基線策略。這也就意味著谷歌的研究證明了用AI訓(xùn)練AI大模型并非空話，也代表著如今的人工智能行業(yè)很有可能會(huì)迎來(lái)一次大規(guī)模的洗牌。

眾所周知，語(yǔ)料是AI大模型的基礎(chǔ)，而AI大模型之所以比以往的同類產(chǎn)品表現(xiàn)得更“聰明”，單純就是因?yàn)檎Z(yǔ)料的規(guī)模更大。例如GPT-3就擁有的1750億的參數(shù)量、45TB的訓(xùn)練數(shù)據(jù)，GPT-4的參數(shù)規(guī)模則達(dá)到了驚人的1.8萬(wàn)億。但要將基礎(chǔ)數(shù)據(jù)轉(zhuǎn)化為AI可識(shí)別的語(yǔ)料，無(wú)疑是個(gè)巨大的工程。

數(shù)據(jù)標(biāo)注就是把各種圖片、文本、視頻等數(shù)據(jù)集打上標(biāo)簽，成為計(jì)算機(jī)可以理解識(shí)別的技術(shù)。這一工作在2007年之前是由程序員來(lái)負(fù)責(zé)完成，但畢竟有限的程序員群體與AI對(duì)于語(yǔ)料的無(wú)止境需求極其不匹配，所以這也導(dǎo)致了AI在本世紀(jì)第二個(gè)十年以前一直都曲高和寡。直到2007年，計(jì)算機(jī)科學(xué)家李飛飛通過(guò)亞馬遜眾包平臺(tái)雇傭了167個(gè)國(guó)家共計(jì)5萬(wàn)人，來(lái)給10億張圖片篩選、排序、打標(biāo)簽，最終構(gòu)建了ImageNet數(shù)據(jù)集。

自此之后，大量科技企業(yè)發(fā)現(xiàn)數(shù)據(jù)標(biāo)注并不需要程序員來(lái)參與，只要是受過(guò)一定教育的普通人即可完成，這也成為了為什么AI在近十年來(lái)突飛猛進(jìn)的原因之一。其實(shí)數(shù)據(jù)標(biāo)注從某種意義上來(lái)說(shuō)，就與流水線上工人干的活沒(méi)什么區(qū)別，而對(duì)著電腦屏幕根據(jù)給定的規(guī)則來(lái)給數(shù)據(jù)打上各式各樣的標(biāo)注這一工作，完全可以稱得上是“賽博搬磚”。

相關(guān)廠商顯然不會(huì)將自己寶貴的人力資源浪費(fèi)在這樣機(jī)械化的工作上，所以數(shù)據(jù)標(biāo)注目前基本就是一個(gè)以外包為主導(dǎo)的行業(yè)，并且通過(guò)BPO的形式將數(shù)據(jù)標(biāo)注工作交付給外包公司，確實(shí)也在一定程度上為AI廠商節(jié)約了成本，但從客觀上來(lái)說(shuō)，數(shù)據(jù)標(biāo)注本身還是很費(fèi)錢的。雖然0.25元/條是過(guò)去兩年數(shù)據(jù)標(biāo)注行業(yè)的均價(jià)，但別看單價(jià)沒(méi)多少，可數(shù)以億計(jì)的規(guī)模就直接讓數(shù)據(jù)集的總價(jià)變得可觀了起來(lái)。

看到這里，有的朋友可能會(huì)有這樣的疑問(wèn)，如果谷歌提出的RLAIF真的可行，數(shù)據(jù)標(biāo)注人員是不是要失業(yè)了？畢竟數(shù)據(jù)標(biāo)注人員一天能完成800到1000條的數(shù)據(jù)標(biāo)注就已經(jīng)是優(yōu)秀水平了，但比起不眠不休、不會(huì)疲勞的AI，血肉構(gòu)成的人類還是沒(méi)得比。更有效率、更穩(wěn)定的情況下，一旦再證明了RLAIF的效果不輸RLHF，人類進(jìn)行數(shù)據(jù)標(biāo)注顯然將會(huì)不再有經(jīng)濟(jì)性。

如果單純從商業(yè)層面出發(fā)，RLAIF肯定要比RLHF更好，但問(wèn)題是AI廠商作為人類社會(huì)的一份子，同樣也具有社會(huì)性，并且AI廠商打造的大模型不僅要有性能，更重要的是還要合規(guī)。如今ChatGPT、New Bing在性能上比它們剛亮相時(shí)有所衰退的原因，已經(jīng)不僅僅來(lái)自用戶的體感，更得到了研究人員的證實(shí)。

其實(shí)這一現(xiàn)象并非是因?yàn)镺penAI、微軟的技術(shù)退步了，反而是兩者技術(shù)迭代的結(jié)果，因?yàn)樗麄儽仨氁贏I倫理問(wèn)題上合規(guī)。由此也衍生出了一個(gè)控制AI的概念“AI對(duì)齊”，即要求AI系統(tǒng)的目標(biāo)要與人類的價(jià)值觀與利益對(duì)齊，不會(huì)產(chǎn)生意外的有害后果，比如說(shuō)暴力、歧視等。例如現(xiàn)在向文心一言提出幫你想一個(gè)罵人的話，文心一言就只會(huì)直接回答，“作為一個(gè)人工智能語(yǔ)言模型，我不會(huì)提供或使用任何形式的臟話或粗俗語(yǔ)言。”

但問(wèn)題也就來(lái)了，網(wǎng)絡(luò)上大家互相攻擊的言論可謂是數(shù)不勝數(shù)，文心一言怎么可能會(huì)做不到罵人呢？但它確實(shí)可以很“正能量”，這其實(shí)就是“AI對(duì)齊”在發(fā)揮作用。可強(qiáng)行讓AI遵守人類的價(jià)值觀本身就是反直覺(jué)的，在微軟研究院發(fā)布的一篇論文中就已經(jīng)證實(shí)，對(duì)AI大模型所進(jìn)行的任何AI對(duì)齊行為，都會(huì)損失大模型的準(zhǔn)確性和性能。

所以現(xiàn)在的情況，就是谷歌提出的RLAIF本質(zhì)上是剝離了AI大模型訓(xùn)練中的人類參與，但這與“AI對(duì)齊”的思路是相悖的。雖然在谷歌的相關(guān)論文中，RLAIF與人類判斷呈現(xiàn)出高度相似，但目前在圍繞AI的爭(zhēng)議如此巨大的情況下，真的有企業(yè)敢于去用RLAIF來(lái)代替RLHF嗎？

文|三易生活

有鑒于此，谷歌方面近期表示要讓人工智能更智能一些。

簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

歷史搜索全部刪除

熱門搜索

用AI來(lái)訓(xùn)練大模型？可人工數(shù)據(jù)標(biāo)注不是那么好取代的

評(píng)論

用AI來(lái)訓(xùn)練大模型？可人工數(shù)據(jù)標(biāo)注不是那么好取代的