文|華商韜略 張靜波
美國好萊塢,16萬人宣布集體罷工,抗議AI入侵……
但與此同時,萬里之外的黃土高原上,很多沒念過大學的女人,卻因為AI找到了工作,改變了人生。
01 他們在喂養AI
陜西清澗,地處黃土高原。
過去,這里的特產只有紅棗。但近年來,隨著氣候變化,紅棗減產,很多年輕人背井離鄉,到外地謀生。
30歲的曹亞麗,卻屬于少有的逆行者。
2019年,因為家庭變故,她從西安回到清澗老家。但小縣城不好找工作,曹亞麗在家閑了一年多,非常焦慮。
直到2020年,一家叫清澗愛豆的公司,改變了她的命運。
《南風窗》雜志記者,通過走訪,記錄下了曹亞麗的故事。
在清澗愛豆,曹亞麗成了一名AI數據標注員。
她和同事每天的工作,就是通過畫框、貼標簽、排序、找不同等方式,為文字、圖像、視頻等做標注。
正是靠她們的辛勤工作,給AI喂養了大量的數據,AI大模型才越來越聰明。
盡管這份工作并不輕松,平均每天要看3萬張圖。但一想到,從此告別面朝黃土背朝天的生活,曹亞麗還是很興奮。
“鼠標一點都是錢啊。”
與曹亞麗相比,34歲的王慧之所以選擇這份工作,更多是厭倦了全職媽媽的身份。
三年前,她還是一位全職媽媽,全身心撲在孩子上。這樣的生活,雖然也不錯,但總感覺缺點什么。
一次偶然的機會,王慧在朋友圈看到了清澗愛豆的招聘廣告,心動了。
“數據標注師是弄啥的?以前都沒聽說過。”對于在家里待了多年的王慧而言,自己還能不能出去工作,都是個問號,更別提這么新潮的工種。
但經過培訓,加上自身努力,她很快就上手了。
“原來總覺得生活很難再有變化,現在我明白了,只要抓住機會,未來還有多種可能。”
不止曹亞麗、王慧,也不止陜西清澗。
近年來,隨著AI大爆發,對數據標注員的需求激增。在山西、貴州……全國許多地方也都增加了這個新職業,從業者眾多。
在互聯網大廠中,僅字節跳動在濟南、天津、武漢的數據標注員,就多達4萬人。
如果再加上第三方數據標注服務公司,比如全國最大的Testin云測,以及前面提到清澗愛豆等,從業者總數更是驚人。
據《科技日報》報道,僅北京一地,就有100多家從事數據標注的公司,全國從事這項工作的人可能超過千萬。
AI不但改變了很多人的命運,也在改變著中西部地區的經濟面貌。
陜西清澗是著名的革命老區。
但受限于地理環境,這里的經濟一直不太理想,期間曾嘗試過養豬、種果樹、畜牧業等很多產業。
“人們能想到的農村能干的,我們縣都干過,幾乎都失敗了。”
相比之下,AI數據標注,成為少有在這里成功立足的產業。如今,清澗愛豆已成為當地最大的用工企業。
重慶奉節,是“朝辭白帝彩云間,千里江陵一日還”的白帝城所在地,也是李白、杜甫、白居易、蘇軾、蘇轍等上千詩人或旅居,或做官,留下上萬首詩篇的三峽門戶。
這里擁有如詩如畫的壯美與秀美山川,但卻長期現代化產業企業缺位,并且戴了多年的貧困縣帽子。
一個工廠都沒幾座的地方,引入百度、京東這類浪潮之巔的企業,這在過去是想都不敢想的。但新一屆縣委、縣政府領導,目光敏銳,大膽想象,小心求證,決定在數字經濟浪潮找到一席之地,并迎來百度、京東、網易等數字化企業,融入了信息工業與數字經濟時代。
其中的百度智能云數據產業基地,同樣在上演著寶媽成為數據標注師的故事,并在短短一年發展到超過500人的規模,成為當地就業新增長極。
02 AI背后,是大量的人工
人工智能,在很多人的潛意識里,意味著智能取代人工,以及大量的失業。
但鮮為人知的是,AI的背后,離不開大量無名英雄的喂養,他們就是數據標注員。
為什么AI需要數據喂養呢?這涉及機器學習和人的區別。
我們知道,人有舉一反三的能力。舉個例子,我們看到一只貓,就能識別出它是貓,甚至是什么種類的貓。
但機器不一樣,它需要舉三反一,通過大量的數據來學習如何識別一只貓。
那么,誰來給AI喂養數據呢?答案是數據標注員。事實上,當投喂的數據質量越高,AI就越強大。
因此,業界流傳著一句話:人工有多強大,智能才有多強大。
2005年,當人工智能還處在萌芽狀態時,業界大佬朱純松就從美國趕回故鄉湖北鄂州,在那里創辦了蓮花山研究院。
據說,那里有當時世界上最早的大數據標注團隊。
但彼時,數據質量還未被廣泛關注,人工智能繼續沿著算法與模型的路徑,緩慢發展。直到2012年一個叫 AlexNet的AI模型,在ImageNet挑戰賽中一鳴驚人。
ImageNet是一個大型的數據庫,擁有1400萬張已被標注的圖片。
著名華裔計算機科學家李飛飛是該數據庫項目的發起人之一。在那之前,業內普遍的研究方向是模型與算法。
李飛飛另辟蹊徑,從數據質量入手。
今天,ImageNet已經是世界上最大的圖像識別數據庫,它催生了2012年新一輪的人工智能浪潮。
在這個數據庫背后,是來自160多個國家的近5萬名數據標注員,他們足足花了三年時間才把這些圖片全部標注完。
沒有這些被標注的圖片,AI就不可能完成歷史性的一躍。
數據標注究竟有多重要?或許可以用業界流傳的一個故事來說明。
幾年前,在美國,一輛某品牌的自動駕駛汽車,鉆到了大卡車下邊,最終導致車毀人亡的慘劇。
事故調查顯示,車的攝像系統把白卡車誤認成了白云,原因是:數據標注沒有做好!
“我們就像AI的眼睛,帶它看世界,理解世界,快速成長。”對于數據標注的重要性,一位從業者如此形容。
正是成千上萬的數據標注員,日復一日地拉框,教會了人工智能理解人類世界。
不過,真正讓數據標注火了的,是ChatGPT。
2019年,OpenAI創始人山姆·奧特曼,向微軟提出一個大膽想法:構建一個AI系統,永遠改變人類與計算機交互的方式。
這就是今天風靡全球的ChatGPT。
為了打造ChatGPT,OpenAI除了需要微軟大筆的投資支持,用來購買算力,同時還需要解決一個難題:
讓大模型學會識別暴力、仇恨等帶有攻擊性的言論。
這個過程需要大量的人力來給攻擊性言論做標注。于是,OpenAI找到外包公司Sama達成合作。
由OpenAI提供數據,然后Sama在非洲肯尼亞雇人進行數據標注。
盡管Sama的行為,被很多媒體批評為血汗工廠,但數據標注卻給當地帶來了大量的工作機會。
今天,在人工智能大爆發的背景下,Sama儼然成為包括谷歌、微軟和OpenAI在內,全球許多AI巨頭的秘密武器。
這個過程,也在全球范圍內,催生了大量新的工作崗位。
03 不要做勒德分子
在人類歷史上,每一輪科技革命,幾乎都伴隨著人們的失業焦慮。
19世紀,隨著機器在英國工廠得到廣泛應用,大量的熟練工人被迫下崗。其中,一個叫勒德的人,一怒之下,帶領工人打砸機器。
這些人,后來成為被嘲笑的對象,經濟學家給他們取了個外號:勒德分子。
法國人巴斯夏,更是無情地嘲諷道:
“你們說新技術摧毀就業,那技術倒退是不是能增加財富呢?”
反問完后,巴斯夏還舉了個例子。如果你發現新的大斧頭太好用了,干脆把所有大斧頭都換成小斧頭,這樣原本一天可以砍斷的樹,就得三天才能砍斷。
這樣就能創造更多就業,就能養活更多的伐木工人嗎?
巴斯夏的嘲諷,對勒德分子一擊致命。
事后,人類社會的發展,也進一步證明:勒德分子的焦慮,其實是杞人憂天。
機器的普及,不但沒有消滅人類的就業,相反,技術進步讓人類分工更細密,生產效率越來越高,也需要更多的勞動力。
最新的一個例子是,很多人抱怨,互聯網電商把實體店鋪擠垮了。
但它同時,也催生了數量多到過去難以想象的快遞、外賣小哥、網約車司機、程序員等眾多新的崗位。
事實上,今天在中國,快遞員、外賣配送員等新就業形態勞動者,多達8400萬人。
AI同樣不例外。
它在取代一些傳統工作崗位的同時,也正在創造大量新的工作崗位。數據標注員,只是其中的冰山一角。
未來,社會對圖像識別、算法研究、深度學習等崗位,必然會產生大量需求,這都是人工智能產生的就業新機會。
這還沒包括因為AI,將被徹底重構的千行百業。
對此,高盛集團曾發表了一份研究報告《AI對經濟增長潛在的巨大影響》。在這份報告里,高盛上來就表明了自己的立場和觀點:
從歷史經驗來看,AI取代的工作崗位,將被它創造的新的就業機會抵消!
然而,這并不意味著,我們可以高枕無憂。事實上,自從ChatGPT大火以來,它確確實實給很多人帶來了就業危機。
比如,好萊塢的演員、編劇、攝影師們,就坐不住了。
16萬人宣布集體罷工,這在好萊塢的歷史上,絕無僅有,也注定要被寫進影史。
但罷工阻擋不了人類步入AI時代的浩蕩大勢。對此,正確的做法,不是像勒德分子一樣砸掉機器,而是:
主動改變自己,去適應新的時代!
參考資料
[1]《人工智能背后人工力量:全國從事數據標注人數超千萬》科技日報
[2]《黃土高原上,沒上過大學的女人們在喂養AI》南風窗
[3]《訓練人工智能的中國縣城工人》,藍字計劃