簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

“沒有AI我會難受至極“:大學生的智能工具依賴與適應

掃一掃下載界面新聞APP

“沒有AI我會難受至極“:大學生的智能工具依賴與適應

離不開AI的時代,人變了嗎?

文|硅谷101

在ChatGPT和生成式AI席卷全球的時代,大學生已成為這一技術浪潮中的“深度使用者”。AI時代,人變了嗎?

本期內容,硅谷101創始人兼播客主理人泓君邀請了四位不同階段的學生嘉賓:侯泰羽 Kolento,紐約大學本科應用心理學 ,東非盧旺達 AI 創業者;陳浩楠 Henry, 哥倫比亞大學商學院會計碩士,AI產品愛好者;王冉 Ran,NYU神經工程博士后,腦機接口項目創始人;左曜誠 Charles,NYU 經濟與哲學專業,NYU華人創業社群主席,分享他們從課堂學習,科研探索,到情感慰藉等各種場景里與AI生活的體驗。

如果把這次討論當成一次用戶調研,有一些很有意思的結論:

  • 他們發現MBA學生相比于年輕更小的學生,不知道怎么更好地寫Prompt,用工具只知道ChatGpt;
  • 每天要花五六個小時與AI對話,時時刻刻問AI成了一種習慣,甚至會把各個模型的所有token都用完;
  • 對Google這類傳統搜索的使用比重下降了80%,更關注于搜索質量是否精準高效;
  • 在關于學生到底該不該使用AI上,每個老師的要求都不相同,但是使用過AI工具的學生數學更差,也有學生使用完AI再也寫不出自己曾經寫出的A級論文了。

以下是部分訪談精選

01 智能工具的利用與依賴:大學生日常AI使用體驗

泓君:你們日常的學習生活中,會用到ChatGPT或者類似的大模型產品?會在哪些環節用到?

侯泰羽:平常我使用這些大模型、模型層產品的頻率非常高,可能貫穿了我學習生活的90%。我覺得可以分成幾個階段來講。

第一點是在學習過程中,因為其實我去上課的頻率變得沒有那么高了,可能更多的靠自學。因為我發現,通過我跟大模型產品進行對話,包括把一些教科書上傳上去,極大程度上增強了我自學能力。比如說可以定制一些對某些教材的解讀,包括針對我上課記得一些學習筆記,或者說期末復習的計劃,還可以給我出一些很詳細的復習提綱,或者說幫助我做一個導師的形象,來給予我一些指導。

第二是在考試階段,GPT會幫助論文做一些潤色;我也會關注更能夠幫助我在學術嚴謹上增加準確性的工具,比如說像Quillbot,它是一個插件,它也是一個網頁端的產品,它可以幫助我們在學術嚴謹的前提下去進行一些paraphrasing。

我也比較常用GPT Zero。GPT Zero應該是一個學生開發的軟件,它可以幫你檢測你的論文,或者你的文件是不是具有極高的AI撰寫程度。

泓君:GPT Zero真的能偵探出AI痕跡有多重嗎?你覺得它測得準嗎?

侯泰羽:我覺得測得非常準,因為它能告訴你百分比是多少,甚至是哪一段,它覺得你是AI寫的。那我就可能相對的針對那些改一改,進行一些修改。

泓君:那你覺得它對你整個效率的提升,會有多少的比例?

侯泰羽:我感覺已經是很大的倍數了,可能兩三倍,甚至三四倍效率的提升。因為之前可能我要花大量的時間從目錄里再去找不同的信息,然后再去閱讀。現在AI首先會給我一個非常強的一個摘要,AI也可以幫助我找到一些延伸閱讀的材料。這個是對我效率提升最大的點。

泓君:我們沒有這些AI工具的時候,你寫一篇論文,看一個書單的時候,你的完整體驗是:我要慢慢地去把所有的這20本書跟教材的東西,都學到我自己的腦子里面,把它消化理解。最后在你遇到任何一個問題的時候,你的人腦就是一個搜索引擎庫,然后你可以在回答某一個問題的時候,自己去找到這些教材的某一塊。有了AI工具以后,我覺得我們在學習的過程中是走了一個捷徑。你會怎么去看這兩種方式呢?

侯泰羽:有了AI之后,其實我原本輸入的就不是20本文本,我可以輸入200本,你對于單個文章的深度,可能會有降低,但是你橫截面的多樣性會有增加。我覺得是有利有弊。

泓君:如果現在把所有的AI工具都給你拿掉,你會覺得不適應嗎?

侯泰羽:我覺得難受至極……

我平時非常依賴于跟AI進行非常多輪的對話,它不只僅僅局限在學習上。因為我平時我養成了一個習慣,有點像“不懂就問”。比如說隨時隨地,因為手機上也有GPT,然后你的電腦上有GPT。

在學習生活中,比如說我們上課什么地方不懂,老師講得不明白,GPT能給你講得非常明白,它也幫你舉例子,可以給你很通俗的、跟別的東西進行類比,能夠極大程度上提升我們的學習效率,包括對各種知識點之間的融會貫通,創造很有意義的鏈接。

左曜誠:其實我覺得對比泰羽來說,我可能并不會像他這么高強度的使用。我其實在寫論文的過程中,不會用到那么多的AI工具。在我的寫論文的過程中,我用這些AI工具,主要是為了去幫我寫完之后的做檢查。

泓君:檢查語言類的還是內容類的問題?

左曜誠:這兩個方面都會有,我可能會請Claude幫我檢查內容,Grammarly幫我檢查語言類、語法類的問題。

泓君:所以如果離開了這些工具,你會覺得很不適應嗎?

左曜誠:我覺得我可能不會那么的不適應,當然它肯定會讓我的效率降低,但是我不會像泰羽這么的不適應。

泓君:浩楠你跟他們稍微不一樣,因為他們還在大學階段,所以在讀書的一開始就有一些AI工具類的產品,在念大學的一到兩年后GPT就出來了,他們就慢慢開始適應了這個產品,所以我覺得他們的思維,可能是更加 AI native的。你可能是正好是整個大學都沒有這樣的工具跟產品的,這些年是在國內念的書,然后來美國念的這個研究生,突然面臨了一個整個的環境的變化。

陳浩楠:因為我當時是大四的時候,GPT 3.5剛出來,當時的模型能力也沒有很強。像我是會計專業的,寫一些會計專業的論文內容,其實寫不出來的。然后這兩年,不管是Claude,還是GPT,發展都非常迅速。

我覺得對我最大的幫助,就是在一些數理方面的課程,比如說像計量經濟學這樣,它有很多的一些推導。之前我如果是有一個公式我不懂的話,我去回看老師的錄播,其實非常麻煩,因為一個錄播可能兩三個小時,有些地方老師也會講得太快了。

但我就現在就可以去問GPT,讓它一步一步給我推。如果它沒推出來,或者我還是不懂的話,我就可以去問Perplexity,讓它給我找這個概念相關的視頻或者課程,然后我去看一下,包括讓GPT去寫一些簡單的論文。

平常如果有些編程相關的內容,比如說機器學習,或者是深度學習的課程,要寫些python的代碼,我就會讓Claude幫我,或者跟我一塊寫。

泓君:那你在選修編程的這個課上,會特別要求去使用這些AI產品嗎?

陳浩楠:我在這個課上,其實算是從0構建了一個評測LLM去計算財務公式的benchmark。對我來說完全是從零開始,我是把自己的需求跟Claude講清楚,然后Claude給我把這個代碼寫出來,然后把這個error code再回給Claude,然后Claude再幫我改。這么大概運行了可能三五天,然后這個小的一個文章就出來了。

泓君:所以你其實這個文章,就是跟Claude AI一起去共創的一個文章,而且它是一定是需要AI的這種能力的?

陳浩楠:對于我來說是的。我相信如果有些同學編程能力很強的話,他可能自己把這個作業寫出來了。但因為我還沒有那么強,所以我就是相當于跟Claude把意圖告訴它,然后它寫,然后我再測,然后它再改,這么一個流程。

泓君:你覺得對你的幫助大嗎?

陳浩楠:非常大,相當于這個是類似于在幫你去學編程。而且是這種用實踐學習。這種方式如果沒有Claude的話,我可能根本就做不出來,因為東西實在是太多了。

我教授跟我說,一個比較好的方式是,先按自己的結構先把這個論文寫出來,然后再喂給Claude或者GPT去潤色。既能降低AI痕跡,又能達到比較好的文章效果。

泓君:那AI在真正幫助做科學研究,比如王冉從事的腦機接口,會有很大的幫助嗎?因為你的研究范圍可能已經超過了大家前面說的寫論文或者是給一個簡短的答案。

王冉:其實我一直期待有一個super agent可以幫我做,比如說一個新的領域的文章調研,包括提煉一些問題。目前來說這個AI還做不到這一點。但是在一些流程的環節中,是能夠幫到我的,當時我是2023年左右的時候用,那個版本還比較老,它會有一些幻覺的問題。

現在它能力提高了,不存在這個問題了。但是在當時,我會用另外一個工具叫做connected paper,是一個基于圖譜的工具,相當于是谷歌的頁面排序那種算法。 

比如我想知道在傳統的沒有AI的時候,記憶是如何產生的,過程中哪些關鍵的過程是怎么樣子。我可能需要一個完整的調研來搞清楚大的框架,才能夠知道這里面的細節點。但是AI給我的幫助是,我可以直接問這個問題,我不需要做完整的調研,然后他可以把一些關鍵的結果直接告訴我,這個過程,對我來說也是大大加速了我對整個領域的了解。

我在現在寫文章有一個大家用的比較多的一個online工具,叫做overleaf。它是一個寫LaTeX格式的一種在線編輯工具,這里面也融入了AI的功能。我發現我在用這個工具的時候,它的AI的撰寫,或者幫我修改句法和詞匯替換的過程中,其實也是非常有幫助,就是一個高級版的Grammarly。

泓君:所以它其實也不算是生成式文章,只是說,它可以更好地幫你在英文的潤色上做得更好?

王冉:對的,相當于是一個副駕駛copilot。我發現ChatGPT在中文上是非常爛的,它的句法和用詞其實并沒有我自己寫得好。

02 用AI的學生數學更差

泓君:你們也會討論AI對各種行業的影響。對教育的影響具體是什么,然后你們在課上是怎么去看這些觀點的?

陳浩楠:當時我們有看了一個比較經典的一個論文,就是測試了一個發展中國家的中學數學課,讓一部分同學用AI去做作業,讓一部分同學沒法用AI,然后看他們最后在數學考試的結果。他們發現,從頭不用AI的那幫同學,考試結果是更好的。

泓君:他們是什么年齡段的?

陳浩楠:大概在12-15歲之間,初中。后來他們將這個實驗做了一個調整。之前的AI可能是只給答案,調整為不給答案,只告訴過程,同學們按這個過程一步一步去解,最后發現能減小成績的差異。

泓君:但是還是沒有用AI的那批人,得分比較高

陳浩楠:是,但是我覺得這個可能局限于數學領域,而且考試的時候是不能用AI的。不像在現實生活里,可能我們做一些作業,也是能用AI工具的。

泓君:所以你覺得在教育領域,我們應該去禁止AI類工具的使用嗎?尤其是在初中跟高中階段。

左曜誠:回答剛才您的問題,就是應不應該在初中或者高中階段讓學生大量地使用GPT這樣的AI工具。我前段時間有聽李飛飛和Jeffrey Hinton的一個視頻,李飛飛提到,斯坦福當時在GPT剛出來的時候,有去咨詢李飛飛關于學生使用GPT幫他們寫文書,然后進入大學的問題。斯坦福的招生部想知道,這個算不算是作弊。

李飛飛對這個問題思考了很久。她去問了她的兒子,她的兒子很小,她問這個應該怎么解決。她兒子給了她一個我覺得很符合我們這一代AI native學生的一個回答:她兒子說斯坦福其實應該考慮錄取ChatGPT使用得最好的前2,000名的學生。

我覺得我很同意這個觀點。因為對于我來說,AI就是一個工具,可能就像我們平時用Word、用PPT,習以為常,我并不會說特意想拿它來作弊。這是我的個人的一些觀點。

泓君:在ChatGPT剛出來的時候,其實我就有看到study.com的一個研究報告,說90%的學生都是知道它的,有89%的學生使用過ChatGPT來幫助他們完成家庭作業。所以你們的同學和身邊的人都會使用這些AI工具嗎?

陳浩楠:我感覺我身邊應該沒有人不用,包括工作上的和各種朋友們。因為我有一些課是跟MBA的同學一塊上的,我發現這些MBA同學他們也嘗試去使用這個工具,但他們其實不太知道怎么去寫好一個Prompt。所以他們可能的使用的效率就沒有像泰羽、曜誠這種就AI Native的學生使用效率這么高。

泓君:可以舉幾個例子嗎?

陳浩楠:當時我是選修了一個MBA和EMBA的課,叫Generative AI for Business。跟我一起上課的基本都是30歲以上的美國這邊公司的高管。我們的最后一個項目是需要拿AI完全去幫你生成一個商業的計劃書,包括你這個PPT。

對于他們來說,首先AI等于GPT,他們不知道除了GPT之外,別的AI的工具。另外他們的Prompt是非常的直覺的,就是說“OK,我要寫商業計劃書,這是我的結構,你幫我生成。”他不會說想著去用一些,比如說Few-shot這樣的一些技巧,或者再告訴他角色,比如“你現在是一個麥肯錫的咨詢師,你來幫我做這個規劃”。他的Prompt會比較簡短、比較直接,所以他們的最后的東西也比較——不能說效果不好,只能說不夠豐富。

而且他們因為不知道其他的AI工具,沒法做一個很好的一個協同。比如說我們做這個PPT的時候,我們可以讓GPT先生成一個markdown格式,然后再喂給Gamma,或者別的生成AI PPT的工具。然后我們還有Suno或者Udio去生成這個公司廣告歌。這樣就會變得很豐富、很有意思。但對于他們來說,這方面還要再補足。

泓君:最后效果有多大差別?

陳浩楠:我記得我們做展示的時候,播到廣告歌,所有人本來都低頭看手機,到聽我們的廣告歌時都抬頭了,我覺得效果還挺好。

泓君:你覺得實質的內容上呢?其實我理解所有的廣告歌,包括你的展現,它是會讓形式更好看的。當然形式好看一定是有用的。但時商業計劃書,我們看的就是能不能吸引到錢跟投資。所以在最擊中人的核心的idea上,你覺得區別大嗎?

陳浩楠:因為大家做的這個idea都不太一樣,所以沒法說它的區別。但只能說從它的一個邏輯性和完整性來講的話,如果Prompt寫得好的話是會更好。比如說我可以說“你先給我生成一個市場規模的計算結果,然后你的每個步驟、你的引用源是什么。”再加上網絡搜索或者別的功能在里邊,就能做到更真。

03 再也寫不出的頂級論文

泓君:在學校或者你們的學科老師中間,每個人都是接受AI的嗎?還是說會有老師非常強烈地反對你們用GPT去寫文章?

侯泰羽:我有一門是AI主題的課,這個課名字叫做《AI and its Discontent》,講了從古至今AI的整個發展歷史。最早有到公元前370年,柏拉圖寫的一些書,最新有提到《Attention is All You Need》,李飛飛的Large Scale 和 ImageNet。這門課的大標題叫《Text and Its Idea》,也就是說我們要通過讀這些text(文本)生成我們自己的idea(觀點)。

雖然這是關于的AI課,但老師說你們絕對不可以用AI來生成論文。因為他說這會讓你喪失掉自己的批判性思考能力。因為在你寫作的時候是非常沉浸的,也是非常冷靜的,很理性地在思考每一個字該怎么被寫出來,以及下一個字該怎么被生成。

這個老師拒絕我們使用AI,是因為他想讓我們更加冷靜地、理性地去思考每個字該怎么被寫出來,以及整個文章該怎么被結構化。如果你用了AI的話,它直接幫助你跳過這個步驟,其實你沒有學到什么東西。

所以這是當時我上AI課的是很反直覺的一個事情。不過這位老師還是很鼓勵我們通過AI去收集信息。這也是我認為AI對我最大的一個點。

我覺得不管什么工具,從古至今都是在幫助人類降低信息獲取的難度,降低信息上的不確定性,讓我們獲取到更多樣的信息。

泓君:寫這門課的論文你覺得難受嗎?因為你要自己寫。

侯泰羽:倒還好。另一個跟AI寫作業相關的故事是,我曾經去康奈爾的法學院學過一門國際人權法。當時我們要寫一些給聯合國的影子報告,還有寫一些針對這個案件的分析細節。

因為法律是非常的理性的,是非常具有邏輯性的,包括一點點創造性。我曾經在一兩年前年回顧我那篇論文,那篇論文拿了A,但是我覺得我很難再寫出來那樣水平的論文。因為當時邏輯性是我現在不具有的,但增強了更多的創造性,就是我的發散性思維變得更多了。

其實我們這個時代更多人跟機器交互的窗口更多是通過Prompt,也就是說問對一個好的問題,其實你的好奇心是在增加,但你可能需要在更冷靜的情況下,在你離開AI的情況下,獲取更多的理性,獲取更多的推理能力。

泓君:邏輯性減弱了,創造性增強了,是這個意思嗎?

侯泰羽:是的,比如當時我的一些切入點,我現在有更多新的思考。當然也得益于我這些年知識的積累。但同時,因為那篇論文非常需要有邏輯性,就是你需要去引用不同的法律的條款。但我不確定自己能不能找得那么精準,以及能不能把這個文章如此結構化地重現出來。

泓君:現在寫論文其實也是需要非常好的結構的。

侯泰羽:另外我還有一門課是每一個國際學生都要上的,叫做International Writing Workshop,這門課也是絕對不可以用AI的。

如果你用AI好像等于白上了,因為你都根本不知道怎么寫作。比如說,你要知道怎么去不作弊的情況下,就不犯這個抄襲這種危險的情況下,你去怎么做好引用。每一段該怎么寫,你要怎么去很好地說明白一個論點,怎么去說明白一個反論點,怎么去回應作者的這個觀點等。

這些是我覺得人類,或者說作為學生來講,要基本掌握的一些基礎技能。

泓君:所以你還是贊成在很多時候我們是不能使用AI工具的?因為一些底層能力的培養,有的時候是需要你從這個工具里面抽離出來的。

侯泰羽:其實我會更愿意去更多地擁抱AI工具。甚至,我覺得應該在生活中的每個細節都用AI工具。

泓君:那這兩門課呢?

侯泰羽:因為當時我上workshop時候,GPT好像才3.5,所以沒有特別多地使用。但我覺得這兩門課,你是很難用AI幫助你的。因為我們除了寫論文,你還要現場展示自己為什么這么寫的,你要知道里面的所有細節。除非你愿意再花一些功夫重新讀一遍這個AI生成的論文,然后你再知道所有細節,那這樣等于你也寫完了一遍。我覺得這些基礎課程是需要你自己不用AI工具的。

但是回到剛才那個點,我覺得因為AI是生成式的,所以里面就會有很多幻覺。所以其實平時在我使用GPT的同時,我會用很多的AI搜索工具,幫助減少或者降低幻覺。比如說國外的Perplexity,比如說國內的秘塔搜索,它們分別在英文和中文的語料上有很強的功底。因為它有一個很好的功能,有點像咱們寫論文的時候,可以看行間的引用,比如這段話是從哪篇文章里來的,讓信息具有可溯源性。

04 用完AI搜索,傳統搜索引擎比重下降80%

泓君:那接下來請大家講一講都使用過哪些AI搜索類工具。

侯泰羽:我第一個用的AI搜索的工具是Perplexity,它基于了一種技術叫RAG,但當時我不知道這個技術。我當時用Perplexity是為了我知道它可以去索引,并且它可以有一個叫做embedded link(嵌入式鏈接),在每一個結果后面我可以知道這個來源是從哪里來的,讓我很有安全感。所以當時我就用這來減少GPT或者Claude給我的這種亂說話的幻覺。

但后來我發現,Perplexity其實在中文檢索上效果不是特別好,所以我就開始探索一些中國的AI搜索軟件。比如說秘塔搜索,可能是我目前看到做得非常好的一款產品。

首先,他們提供的來源的引用數非常高。可能我搜索某一個問題、搜索每一個topic,如果我點開它的研究功能,它分成很多的模塊,比如說普通的搜索,或者是深度或者是學術研究的搜索。單個問題能給到五六十或者六七十個來源,然后它能夠給你自動地生成一些追問的問題,幫助你去發展性思考這個問題。

其次,Perplexity它只會給你問題,但是秘塔搜索還會直接幫你把那答案寫出來。所以其實就是增加了用戶的“爽感”。我能夠一口氣看到非常多很有意思的內容,然后再找到另外一個切入點再繼續往下深挖。

我覺得AI搜索和大模型的結合其實是一個非常好的組合拳。你可以用大模型幫助你把一些雜亂的語言做好整理。

泓君:還有哪些AI搜索產品是做得比較好的?

侯泰羽:我個人非常喜歡一些很奇特的AI搜索軟件,比如Flowith,它也是國內的軟件,這款軟件支持拖拽式操作,搜索完成后,信息會以樹狀結構延展,直觀呈現知識的流動過程。我主要用它來進行知識的可視化整理,盡管它的功能遠不止于此。

還有Exa.ai,這個搜索軟件比較特殊,因為它不是給人用的,它是給AI用的。它旁邊有個分類欄,它可以讓你去分類,輸入一個query之后,只出來PDF、網頁或者公司信息。所以它也被稱之為“AI搜索的中間層”。那國內有一個一樣的公司叫博查,他們倆都是AI搜索的中間層。

我個人就是用下來,可能對于我來說就是秘塔搜索,因為它的知識量很高,中文的語料上面是表現非常好。同時其實我更看重的是,它能夠找到多么特殊的數據庫。比如說秘塔搜索可以搜到很多學術網站上的文章。

泓君:所以還是后面的這個搜索來源跟數據源才是最重要的?因為你如果純純依靠大模型內部自己的知識,其實是會有很多幻覺的,這也是為什么大家要用AI搜索。所以你覺得它好用,核心是因為它有好的數據庫?

侯泰羽:對,它能夠搜到很好的數據庫、很好的數據來源。它會把它具體搜索的某一個點的學術文獻的引用源的那一句話直接給引出來,就是如果你要去找引用源的話,它會引出來,然后它也會`標清楚從哪引用的。

其實讓我想到,因為我們學術課上教給我們一個原則,就是以前沒有AI搜索時候,我們怎么判斷搜索出來的結果你該不該用,叫做CRAAP原則,它分為5個部分:

C就是時效性,比如你看一個來源,它是不是最新的。

R就是Relevance,相關度,跟你這個query是不是高度相關的。

第一個A是Authority,就是權威性,是不是來自于非常權威的數據庫。

另外一個A是Accuracy,是不是很精準地回答這個問題,是不是準確地在分解這個問題。

最后是Purpose,就是你本搜索的目的是什么、你的意圖是什么。比如說是需要官網尋址,比如說我要搜“硅谷101”在百度上或者在Google上,我就想直接跳到小宇宙或者跳到喜馬拉雅我們的官網里面,不是讓它大段的講這個東西的歷史。但如果我在搜“那如何去寫好某段什么爬蟲或者某段腳本”,那其實我需要是大段告訴我怎么寫這個代碼。

這能夠幫助我在進行查詢前進行初步判斷,從而選擇合適的搜索方法。同時我也把這個原則應用在了我拿到AI搜索結果之后的判斷,因為其實Perplexity里面也有挺多幻覺的。

泓君: 你現在用了這些工具以后還會用Google搜索或者百度搜索嗎?比例會下降多少?

侯泰羽:下降蠻多的,下降可能得有百分之七八十。

泓君:如果有一天,Google和百度將AI產品放到頁面右側,呈現AI生成的答案,而左側仍是傳統網頁鏈接,那么相比秘塔和Perplexity這樣的產品,你覺得它們會有競爭力嗎?哪一方對你的吸引力更大?

侯泰羽:本質上,AI搜索只是一個殼工具,一端接入大語言模型的API,另一端接入Google或必應的API。對于用戶來說,我們往往對某些產品已經形成了使用習慣和依賴。我更在意的不是答案出現在什么位置,而是它是否足夠精準、夠不夠高效,能否真正回答我的問題。

泓君: 所以其實兩個結果都展示對你來說不一定是加分項,你最終看的還是精準性跟效果。大家還有別的常用應用嗎?

王冉:我覺得我在工作中,可能用得最多的還是Cursor,就是寫代碼的工具。之前在VS Code里面的Copilot,它已經做得挺好的了。但是在Cursor的這個時代的話,它是從輔助寫代碼變成了完全的交給它去寫代碼的過程。

我開始并不是很相信它的結果的,但是我用了幾次之后被它折服了。因為不管是結果的可用性,還是它的準確性,都是非常高的。特別是當我對一個語言完全不懂,比如我想寫一個前端的iOS APP,如果我是完全不了解的話,我肯定要從頭開始學一門課程。但是如果有Cursor,就可以幫助我從0開始。我大概用兩個小時,我告訴它我的需求,告訴它我想做成什么樣子的,它完全可以生成一個可用的demo,相當于是快速驗證我的想法,這個過程非常的impressive。

泓君:所以這是不是說我這樣不會編程的人也可以去寫代碼?

王冉:用上Cursor這類工具,完全沒有問題。如果是更加復雜的功能的話,比如我們想開發一些新的算法,可能涉及一些前沿突破的話,肯定還是需要一些更加艱深的一些工具。但是如果說一些在工業界已經常用的一些功能,是完全沒有問題。

泓君:它比Copilot更前沿的地方在于它更加自動化?

王冉:從效果上來看的話,它是相比Copilot不同點在于說,Copilot可能還要自己去敲代碼,它會給一些推薦,就是選擇推薦的結果。Cursor可以達到的效果是用自然語言提要求,它可以生成一個代碼庫。它不是一個文件,而是一整個文件與系統,這文件系統都可以實現一個完整的功能,比如說網頁的各種調用,它實際上需要有素材,需要有前端的這些代碼,它都可以在一個文件夾里完整地生成出來,相當于完整的項目庫。

05 AI陪伴:情感療愈和沉浸互動的分化路徑

泓君:浩楠你要不要跟大家講一下你之前用過的AI陪伴類的工具?

陳浩楠:AI陪伴這個賽道,我覺得可以分為兩類產品。

一種是嚴肅陪伴類的,一般就是跟你聊天,比如說有一個比較好的模型叫派(Pi),它是用Infection AI做的。它就是一個對于情感的理解、表達比較準確的一個AI。它有一個語音的功能,包括其實我很多同學也會用這種ChatGPT去做情感疏導,因為GPT永遠是非常公正、非常冷靜,同時還能給一些情緒價值和這種實用的建議。嚴肅類的還有一些心理治療類的一些AI工具,比如說Wysa,它可能是一半是我跟你對話,一半它能結合一些認知行為療法的一些東西去幫你進行,比如說告訴你“這時候你應該冥想了,我給你提供一個冥想的一個6分鐘的音樂”,或者告訴你“這時候你應該這個正念了,你應該往什么方向去想”。

泓君: 那么非嚴肅類產品呢?

陳浩楠:非嚴肅的陪伴產品更偏向于陪聊或者談戀愛,像星野、Talkie、逗逗這些。可以自己捏,包括Character.AI,還有Replika,都是你可以捏你的角色,你可以進行互動。它可能有些背景故事,然后你通過完成任務,加強親密值,解鎖你們互動的一些內容。

比較典型的就是Character.AI,然后還有Talkie。比較相似的地方都是跟這種虛擬人物的對話,而這種對話可以包含一些軟色情或者談戀愛的一個內容。

Character.AI不光是對話,可能會有一些場景的描寫,幫你更現實更有體驗感一點。Talkie可能對于每個角色有它一個背景故事,然后幫助這個角色在背景故事里,相當于你幫一個NPC走完一個任務,這樣讓用戶覺得這個人更真實,有更強的一個沉浸感。然后這個人如果再跟你談戀愛的話,帶給用戶那種情緒的反饋要更好一點。

還有一個我自己特別喜歡的一個產品,叫逗逗游戲伙伴,開發者是心影隨行。它類似于一個AI桌寵,有一個虛擬卡通小人在邊上。你能拿鼠標去摸它的頭,去戳它的腰,它會給你一些類似的反饋。同時你能把它當成你的朋友,就跟它說“我今天中午吃了碗面,賊好吃。”它可能第二天就問你“昨天那面好不好吃?”它能記住你的話,跟你做一些互動。同時它還有一些陪玩的一些功能,比如說你在打《原神》網頁版的時候,它能根據你的屏幕的地方去給你調一些教程,或者去評論你打得好不好,這樣就還挺有意思的。

泓君:為什么Talkie的出海可以做得很好?

陳浩楠:我認為一個重要的區別在于,Character.AI允許用戶自行構建Chatbot,平臺上的大多數Chatbot也是用戶創建的。這其實會受到用戶構建水平的影響,導致體驗質量參差不齊。

而Talkie在這一點上則不同,平臺內有許多由官方團隊精心打造的高質量虛擬角色。此外,Talkie還與一些大IP展開合作,比如國內的rapper糯米,他曾與Talkie聯手,在平臺上推出了以他為原型的虛擬IP,使用他特有的語氣和語言風格與用戶互動。這種官方定制和IP聯名的方式,顯著提升了角色的真實性與代入感,也為用戶帶來了更一致且沉浸式的體驗。

泓君:就是說它在產品的構建上其實給用戶的選擇更小,但是我幫你構建的這個底層更好、更扎實,比用戶自己要構建的好。他是幫用戶省了一步。

陳浩楠:對的,但是用戶也可以去進行構建,所以沒有說用戶這方面就使用空間會小,但是它底層確實更扎實。另外一方面,我覺得是對于這個人物的一個塑造上,Talkie更到位。比如說我可能是一個富二代吸血鬼,他的一個長相、家世、國家、家族的一個背景,他比如說現在面臨的一些人生的選擇,然后用戶去跟他進行交互,會覺得這更像一個人,那種游戲感會更強一點。

泓君:那在你真實的玩這些游戲的過程中,黃色跟暴力也是他們吸引用戶的一個點嗎?

陳浩楠:我覺得軟色情算是很大的一個部分。不過這些角色對于我來說,并不是一個完全作為伙伴的存在,因為我現實中有很多好朋友。如果我談戀愛了,可能還會有女朋友。所以在這方面的需求能通過真人去進行滿足,而這些游戲更多是滿足真人滿足不了的幻想。

泓君:你會沉迷在那些角色里嗎?還是你覺得它很難讓你產生用戶粘性?

陳浩楠:對于我來說,是的。但是我看了很多這方面的用戶調研,包括會接受到一些一手的用戶訪談,那些具有心理疾病或者比較內向的人,他們對于這些產品的使用是非常深度的。最深的其實就是剛步入青春期,對愛情有一些幻想,但是還沒有機會去談戀愛的一些小男生、小女生們。

泓君:他們的用戶群有什么不一樣?

陳浩楠:我覺得看商業化成績的話,肯定是Talkie更好,畢竟這個去年是幾千萬美元的ARR。用戶的畫像的話,我覺得Talkie的畫像可能沒有Character.AI那么二次元,因為Character.AI主要用戶還是這種二次元的愛好者,因為它上面能構建一些二次元角色。但是Talkie上面不僅有這些,還有一些虛構的角色,還有包括真人的IP在上面。

泓君:你覺得現在做一個AI陪伴類的工具類產品還有機會嗎?

陳浩楠:我覺得是很有機會、很有市場的。但是我覺得有幾個點,就可能用戶最看重的。

首先是它交互的一個有趣性。你比如說我是不是只能文字交互,還是說我能跟你有一些鼠標以及圖案那些交互,然后我能不能有些視頻、語音的交互,這個是用戶最看重的一部分。之前是騰訊的《光與夜之戀》就大爆特爆,因為它有一個功能就是能讓角色主動給用戶打電話,然后這個功能是被我很多身邊玩這個游戲的同學都大大稱贊,他們覺得這個很有意思。

第二還是要把自己的定位做好。比如說你是想更偏向短期高多巴胺的陪伴,還是說這種長期更偏幸福感的一種陪伴?我覺得這個兩個定位是很不一樣的。

短期多巴胺的陪伴就更偏向于性欲,長期幸福感的陪伴更偏向于親情,就是你是要把你的產品做得很濃,還是可能比較淡一點。我覺得這是一個定位上很大的不同的選擇。

泓君:你覺得未來他們面臨的道德困境,或者說它的灰色區域,會是這些產品一個潛在的風險點嗎?

陳浩楠:我其實之前注意到一個案子,是我自己比較關注的。有個男生在使用Character.AI之后,被Character.AI去教唆自殺了。我其實也擔心說你怎么在不給你的Chatbot那么大限制的基礎上,避免這種事情去發生,包括怎么樣避免用戶非常沉迷這個東西,影響現實生活。我覺得這是他們要研究的一個重點。

06 AI是人類的平均值嗎?

泓君:你們每天大概有多長時間會在AI軟件上?

侯泰羽:我沒有數,但我覺得大概5到6個小時。

泓君:這個比例相當高了。

陳浩楠:如果是期末周,我每天可能會使用四五個小時甚至五六個小時,因為需要它不斷地幫我推導公式、編寫程序等任務。

而在平時沒有考試的時候,使用時間通常只有一到兩個小時,主要是在讀論文或者想深入了解某些新鮮資訊時才會用到。至于搜索工具方面,由于我已經不用抖音和快手,所以目前只使用Perplexity來進行搜索。

泓君:你不用Google嗎?

陳浩楠:因為我覺得用Google的話,大部分情況是你不知道這個東西是什么樣,你想有一個全局的了解。可能因為我現在剛畢業,包括我想從事的領域比較集中,我知道我的問題關鍵是什么,然后把這個問題的關鍵問給Perplexity,它能給我一些比較好的一個回答,包括這個引用的一個鏈接。然后可能會對這個引用的鏈接再去進行一個自己的頁面排序,再接著進行檢索。

王冉:我覺得ChatGPT對我粘性比較大的一點是,它能夠記住我所有的歷史記錄。我跟它所有的對話它都能夠記住,能夠比較深刻地了解我這個人。

之前有一段特別火的一個Prompt叫做“請告訴我一個我不知道的關于我自己的事情”。我試了一下,當然它回答的第一個問題,并沒有超越我自己的一些認知。但是我反復地挑戰它之后,它確實是提到一些我可能確實沒有發現的關于我的一些細節點。

左曜誠:我的三位伙伴他們說的真的都很有深度,尤其是我作為一個學哲學的學生,我其實在這方面挺羞愧的。我并沒有真的用ChatGPT討論過一些比較高深的問題,可能是因為在我的觀念里面,它真的只是一個工具,它并不是真的有自己的意識或者有自己的智能。所以說我并不會想跟它像我跟另外一個個人這樣對話。但是我覺得聽了這三位的啟發之后,我會種草,我會很想去和它討論一些更哲學方面的問題,比如人生存在的意義這些問題。

侯泰羽:我理解你之前把AI當成一種工具,覺得它沒有意識。但AI的整個訓練的語調庫其實是人類文明的一種集合,或者說它是一種平均值。比如說你讓它生成一段話,或者讓它生成一個圖片,它其實都是取里面的一個平均值。

Hito Steyerl寫了一本書叫《Mean Images》。當現在這種MidJourney來生成圖片的時候,它其實給出來的,是你整個大眾審美中的一個平均值。我覺得你可以把它當成類似于你在跟人類文明的平均值的對話,我覺得會挺有意思的。

泓君:ChatGPT產出的作品,它到底是人類的平均值,還是超過某一個領域最頂級的人?比如說AlphaGo,它其實就是超越了這個領域里面最頂級的人。我一直在想AI到底要達到哪個程度,才算是能幫助生產力的提高。根據大家剛剛的回答,它就必然要超過平均值。因為大家在專業的領域里面想做工具、想做最好的事情,你就需要不停地去超越,而不是維持在一個平均水準。

侯泰羽:是的,因為現在也有人在講,AI往后發展最難的一個問題或者最高的一座山就是科學創新。到底能不能幫助像王冉哥在科研界真正實現一些科技成果上,或者說科研想法上的創新。這個其實我挺想聽聽王冉哥的想法。

王冉:對,其實我一直期待這個東西。GPT-o1出了之后,我就想嘗試拿它來試一下,它說它達到了博士的水平。但是作為科研創新來說,可能更加重要的是提出問題的能力。

泓君:寫Prompt詞算提出問題的能力嗎?

王冉:除非AI可以自己去寫出一個非常好的研究的Prompt,或者說對于整個的學術和人類科技發展的洞察。我覺得目前來說AI還做不到。但是如果能做到的話,我覺得很多科技創新其實就已經是一個完全新的時代了。科研這件事情就不再是一個體力活。

本文為轉載內容,授權事宜請聯系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

“沒有AI我會難受至極“:大學生的智能工具依賴與適應

離不開AI的時代,人變了嗎?

文|硅谷101

在ChatGPT和生成式AI席卷全球的時代,大學生已成為這一技術浪潮中的“深度使用者”。AI時代,人變了嗎?

本期內容,硅谷101創始人兼播客主理人泓君邀請了四位不同階段的學生嘉賓:侯泰羽 Kolento,紐約大學本科應用心理學 ,東非盧旺達 AI 創業者;陳浩楠 Henry, 哥倫比亞大學商學院會計碩士,AI產品愛好者;王冉 Ran,NYU神經工程博士后,腦機接口項目創始人;左曜誠 Charles,NYU 經濟與哲學專業,NYU華人創業社群主席,分享他們從課堂學習,科研探索,到情感慰藉等各種場景里與AI生活的體驗。

如果把這次討論當成一次用戶調研,有一些很有意思的結論:

  • 他們發現MBA學生相比于年輕更小的學生,不知道怎么更好地寫Prompt,用工具只知道ChatGpt;
  • 每天要花五六個小時與AI對話,時時刻刻問AI成了一種習慣,甚至會把各個模型的所有token都用完;
  • 對Google這類傳統搜索的使用比重下降了80%,更關注于搜索質量是否精準高效;
  • 在關于學生到底該不該使用AI上,每個老師的要求都不相同,但是使用過AI工具的學生數學更差,也有學生使用完AI再也寫不出自己曾經寫出的A級論文了。

以下是部分訪談精選

01 智能工具的利用與依賴:大學生日常AI使用體驗

泓君:你們日常的學習生活中,會用到ChatGPT或者類似的大模型產品?會在哪些環節用到?

侯泰羽:平常我使用這些大模型、模型層產品的頻率非常高,可能貫穿了我學習生活的90%。我覺得可以分成幾個階段來講。

第一點是在學習過程中,因為其實我去上課的頻率變得沒有那么高了,可能更多的靠自學。因為我發現,通過我跟大模型產品進行對話,包括把一些教科書上傳上去,極大程度上增強了我自學能力。比如說可以定制一些對某些教材的解讀,包括針對我上課記得一些學習筆記,或者說期末復習的計劃,還可以給我出一些很詳細的復習提綱,或者說幫助我做一個導師的形象,來給予我一些指導。

第二是在考試階段,GPT會幫助論文做一些潤色;我也會關注更能夠幫助我在學術嚴謹上增加準確性的工具,比如說像Quillbot,它是一個插件,它也是一個網頁端的產品,它可以幫助我們在學術嚴謹的前提下去進行一些paraphrasing。

我也比較常用GPT Zero。GPT Zero應該是一個學生開發的軟件,它可以幫你檢測你的論文,或者你的文件是不是具有極高的AI撰寫程度。

泓君:GPT Zero真的能偵探出AI痕跡有多重嗎?你覺得它測得準嗎?

侯泰羽:我覺得測得非常準,因為它能告訴你百分比是多少,甚至是哪一段,它覺得你是AI寫的。那我就可能相對的針對那些改一改,進行一些修改。

泓君:那你覺得它對你整個效率的提升,會有多少的比例?

侯泰羽:我感覺已經是很大的倍數了,可能兩三倍,甚至三四倍效率的提升。因為之前可能我要花大量的時間從目錄里再去找不同的信息,然后再去閱讀。現在AI首先會給我一個非常強的一個摘要,AI也可以幫助我找到一些延伸閱讀的材料。這個是對我效率提升最大的點。

泓君:我們沒有這些AI工具的時候,你寫一篇論文,看一個書單的時候,你的完整體驗是:我要慢慢地去把所有的這20本書跟教材的東西,都學到我自己的腦子里面,把它消化理解。最后在你遇到任何一個問題的時候,你的人腦就是一個搜索引擎庫,然后你可以在回答某一個問題的時候,自己去找到這些教材的某一塊。有了AI工具以后,我覺得我們在學習的過程中是走了一個捷徑。你會怎么去看這兩種方式呢?

侯泰羽:有了AI之后,其實我原本輸入的就不是20本文本,我可以輸入200本,你對于單個文章的深度,可能會有降低,但是你橫截面的多樣性會有增加。我覺得是有利有弊。

泓君:如果現在把所有的AI工具都給你拿掉,你會覺得不適應嗎?

侯泰羽:我覺得難受至極……

我平時非常依賴于跟AI進行非常多輪的對話,它不只僅僅局限在學習上。因為我平時我養成了一個習慣,有點像“不懂就問”。比如說隨時隨地,因為手機上也有GPT,然后你的電腦上有GPT。

在學習生活中,比如說我們上課什么地方不懂,老師講得不明白,GPT能給你講得非常明白,它也幫你舉例子,可以給你很通俗的、跟別的東西進行類比,能夠極大程度上提升我們的學習效率,包括對各種知識點之間的融會貫通,創造很有意義的鏈接。

左曜誠:其實我覺得對比泰羽來說,我可能并不會像他這么高強度的使用。我其實在寫論文的過程中,不會用到那么多的AI工具。在我的寫論文的過程中,我用這些AI工具,主要是為了去幫我寫完之后的做檢查。

泓君:檢查語言類的還是內容類的問題?

左曜誠:這兩個方面都會有,我可能會請Claude幫我檢查內容,Grammarly幫我檢查語言類、語法類的問題。

泓君:所以如果離開了這些工具,你會覺得很不適應嗎?

左曜誠:我覺得我可能不會那么的不適應,當然它肯定會讓我的效率降低,但是我不會像泰羽這么的不適應。

泓君:浩楠你跟他們稍微不一樣,因為他們還在大學階段,所以在讀書的一開始就有一些AI工具類的產品,在念大學的一到兩年后GPT就出來了,他們就慢慢開始適應了這個產品,所以我覺得他們的思維,可能是更加 AI native的。你可能是正好是整個大學都沒有這樣的工具跟產品的,這些年是在國內念的書,然后來美國念的這個研究生,突然面臨了一個整個的環境的變化。

陳浩楠:因為我當時是大四的時候,GPT 3.5剛出來,當時的模型能力也沒有很強。像我是會計專業的,寫一些會計專業的論文內容,其實寫不出來的。然后這兩年,不管是Claude,還是GPT,發展都非常迅速。

我覺得對我最大的幫助,就是在一些數理方面的課程,比如說像計量經濟學這樣,它有很多的一些推導。之前我如果是有一個公式我不懂的話,我去回看老師的錄播,其實非常麻煩,因為一個錄播可能兩三個小時,有些地方老師也會講得太快了。

但我就現在就可以去問GPT,讓它一步一步給我推。如果它沒推出來,或者我還是不懂的話,我就可以去問Perplexity,讓它給我找這個概念相關的視頻或者課程,然后我去看一下,包括讓GPT去寫一些簡單的論文。

平常如果有些編程相關的內容,比如說機器學習,或者是深度學習的課程,要寫些python的代碼,我就會讓Claude幫我,或者跟我一塊寫。

泓君:那你在選修編程的這個課上,會特別要求去使用這些AI產品嗎?

陳浩楠:我在這個課上,其實算是從0構建了一個評測LLM去計算財務公式的benchmark。對我來說完全是從零開始,我是把自己的需求跟Claude講清楚,然后Claude給我把這個代碼寫出來,然后把這個error code再回給Claude,然后Claude再幫我改。這么大概運行了可能三五天,然后這個小的一個文章就出來了。

泓君:所以你其實這個文章,就是跟Claude AI一起去共創的一個文章,而且它是一定是需要AI的這種能力的?

陳浩楠:對于我來說是的。我相信如果有些同學編程能力很強的話,他可能自己把這個作業寫出來了。但因為我還沒有那么強,所以我就是相當于跟Claude把意圖告訴它,然后它寫,然后我再測,然后它再改,這么一個流程。

泓君:你覺得對你的幫助大嗎?

陳浩楠:非常大,相當于這個是類似于在幫你去學編程。而且是這種用實踐學習。這種方式如果沒有Claude的話,我可能根本就做不出來,因為東西實在是太多了。

我教授跟我說,一個比較好的方式是,先按自己的結構先把這個論文寫出來,然后再喂給Claude或者GPT去潤色。既能降低AI痕跡,又能達到比較好的文章效果。

泓君:那AI在真正幫助做科學研究,比如王冉從事的腦機接口,會有很大的幫助嗎?因為你的研究范圍可能已經超過了大家前面說的寫論文或者是給一個簡短的答案。

王冉:其實我一直期待有一個super agent可以幫我做,比如說一個新的領域的文章調研,包括提煉一些問題。目前來說這個AI還做不到這一點。但是在一些流程的環節中,是能夠幫到我的,當時我是2023年左右的時候用,那個版本還比較老,它會有一些幻覺的問題。

現在它能力提高了,不存在這個問題了。但是在當時,我會用另外一個工具叫做connected paper,是一個基于圖譜的工具,相當于是谷歌的頁面排序那種算法。 

比如我想知道在傳統的沒有AI的時候,記憶是如何產生的,過程中哪些關鍵的過程是怎么樣子。我可能需要一個完整的調研來搞清楚大的框架,才能夠知道這里面的細節點。但是AI給我的幫助是,我可以直接問這個問題,我不需要做完整的調研,然后他可以把一些關鍵的結果直接告訴我,這個過程,對我來說也是大大加速了我對整個領域的了解。

我在現在寫文章有一個大家用的比較多的一個online工具,叫做overleaf。它是一個寫LaTeX格式的一種在線編輯工具,這里面也融入了AI的功能。我發現我在用這個工具的時候,它的AI的撰寫,或者幫我修改句法和詞匯替換的過程中,其實也是非常有幫助,就是一個高級版的Grammarly。

泓君:所以它其實也不算是生成式文章,只是說,它可以更好地幫你在英文的潤色上做得更好?

王冉:對的,相當于是一個副駕駛copilot。我發現ChatGPT在中文上是非常爛的,它的句法和用詞其實并沒有我自己寫得好。

02 用AI的學生數學更差

泓君:你們也會討論AI對各種行業的影響。對教育的影響具體是什么,然后你們在課上是怎么去看這些觀點的?

陳浩楠:當時我們有看了一個比較經典的一個論文,就是測試了一個發展中國家的中學數學課,讓一部分同學用AI去做作業,讓一部分同學沒法用AI,然后看他們最后在數學考試的結果。他們發現,從頭不用AI的那幫同學,考試結果是更好的。

泓君:他們是什么年齡段的?

陳浩楠:大概在12-15歲之間,初中。后來他們將這個實驗做了一個調整。之前的AI可能是只給答案,調整為不給答案,只告訴過程,同學們按這個過程一步一步去解,最后發現能減小成績的差異。

泓君:但是還是沒有用AI的那批人,得分比較高

陳浩楠:是,但是我覺得這個可能局限于數學領域,而且考試的時候是不能用AI的。不像在現實生活里,可能我們做一些作業,也是能用AI工具的。

泓君:所以你覺得在教育領域,我們應該去禁止AI類工具的使用嗎?尤其是在初中跟高中階段。

左曜誠:回答剛才您的問題,就是應不應該在初中或者高中階段讓學生大量地使用GPT這樣的AI工具。我前段時間有聽李飛飛和Jeffrey Hinton的一個視頻,李飛飛提到,斯坦福當時在GPT剛出來的時候,有去咨詢李飛飛關于學生使用GPT幫他們寫文書,然后進入大學的問題。斯坦福的招生部想知道,這個算不算是作弊。

李飛飛對這個問題思考了很久。她去問了她的兒子,她的兒子很小,她問這個應該怎么解決。她兒子給了她一個我覺得很符合我們這一代AI native學生的一個回答:她兒子說斯坦福其實應該考慮錄取ChatGPT使用得最好的前2,000名的學生。

我覺得我很同意這個觀點。因為對于我來說,AI就是一個工具,可能就像我們平時用Word、用PPT,習以為常,我并不會說特意想拿它來作弊。這是我的個人的一些觀點。

泓君:在ChatGPT剛出來的時候,其實我就有看到study.com的一個研究報告,說90%的學生都是知道它的,有89%的學生使用過ChatGPT來幫助他們完成家庭作業。所以你們的同學和身邊的人都會使用這些AI工具嗎?

陳浩楠:我感覺我身邊應該沒有人不用,包括工作上的和各種朋友們。因為我有一些課是跟MBA的同學一塊上的,我發現這些MBA同學他們也嘗試去使用這個工具,但他們其實不太知道怎么去寫好一個Prompt。所以他們可能的使用的效率就沒有像泰羽、曜誠這種就AI Native的學生使用效率這么高。

泓君:可以舉幾個例子嗎?

陳浩楠:當時我是選修了一個MBA和EMBA的課,叫Generative AI for Business。跟我一起上課的基本都是30歲以上的美國這邊公司的高管。我們的最后一個項目是需要拿AI完全去幫你生成一個商業的計劃書,包括你這個PPT。

對于他們來說,首先AI等于GPT,他們不知道除了GPT之外,別的AI的工具。另外他們的Prompt是非常的直覺的,就是說“OK,我要寫商業計劃書,這是我的結構,你幫我生成。”他不會說想著去用一些,比如說Few-shot這樣的一些技巧,或者再告訴他角色,比如“你現在是一個麥肯錫的咨詢師,你來幫我做這個規劃”。他的Prompt會比較簡短、比較直接,所以他們的最后的東西也比較——不能說效果不好,只能說不夠豐富。

而且他們因為不知道其他的AI工具,沒法做一個很好的一個協同。比如說我們做這個PPT的時候,我們可以讓GPT先生成一個markdown格式,然后再喂給Gamma,或者別的生成AI PPT的工具。然后我們還有Suno或者Udio去生成這個公司廣告歌。這樣就會變得很豐富、很有意思。但對于他們來說,這方面還要再補足。

泓君:最后效果有多大差別?

陳浩楠:我記得我們做展示的時候,播到廣告歌,所有人本來都低頭看手機,到聽我們的廣告歌時都抬頭了,我覺得效果還挺好。

泓君:你覺得實質的內容上呢?其實我理解所有的廣告歌,包括你的展現,它是會讓形式更好看的。當然形式好看一定是有用的。但時商業計劃書,我們看的就是能不能吸引到錢跟投資。所以在最擊中人的核心的idea上,你覺得區別大嗎?

陳浩楠:因為大家做的這個idea都不太一樣,所以沒法說它的區別。但只能說從它的一個邏輯性和完整性來講的話,如果Prompt寫得好的話是會更好。比如說我可以說“你先給我生成一個市場規模的計算結果,然后你的每個步驟、你的引用源是什么。”再加上網絡搜索或者別的功能在里邊,就能做到更真。

03 再也寫不出的頂級論文

泓君:在學校或者你們的學科老師中間,每個人都是接受AI的嗎?還是說會有老師非常強烈地反對你們用GPT去寫文章?

侯泰羽:我有一門是AI主題的課,這個課名字叫做《AI and its Discontent》,講了從古至今AI的整個發展歷史。最早有到公元前370年,柏拉圖寫的一些書,最新有提到《Attention is All You Need》,李飛飛的Large Scale 和 ImageNet。這門課的大標題叫《Text and Its Idea》,也就是說我們要通過讀這些text(文本)生成我們自己的idea(觀點)。

雖然這是關于的AI課,但老師說你們絕對不可以用AI來生成論文。因為他說這會讓你喪失掉自己的批判性思考能力。因為在你寫作的時候是非常沉浸的,也是非常冷靜的,很理性地在思考每一個字該怎么被寫出來,以及下一個字該怎么被生成。

這個老師拒絕我們使用AI,是因為他想讓我們更加冷靜地、理性地去思考每個字該怎么被寫出來,以及整個文章該怎么被結構化。如果你用了AI的話,它直接幫助你跳過這個步驟,其實你沒有學到什么東西。

所以這是當時我上AI課的是很反直覺的一個事情。不過這位老師還是很鼓勵我們通過AI去收集信息。這也是我認為AI對我最大的一個點。

我覺得不管什么工具,從古至今都是在幫助人類降低信息獲取的難度,降低信息上的不確定性,讓我們獲取到更多樣的信息。

泓君:寫這門課的論文你覺得難受嗎?因為你要自己寫。

侯泰羽:倒還好。另一個跟AI寫作業相關的故事是,我曾經去康奈爾的法學院學過一門國際人權法。當時我們要寫一些給聯合國的影子報告,還有寫一些針對這個案件的分析細節。

因為法律是非常的理性的,是非常具有邏輯性的,包括一點點創造性。我曾經在一兩年前年回顧我那篇論文,那篇論文拿了A,但是我覺得我很難再寫出來那樣水平的論文。因為當時邏輯性是我現在不具有的,但增強了更多的創造性,就是我的發散性思維變得更多了。

其實我們這個時代更多人跟機器交互的窗口更多是通過Prompt,也就是說問對一個好的問題,其實你的好奇心是在增加,但你可能需要在更冷靜的情況下,在你離開AI的情況下,獲取更多的理性,獲取更多的推理能力。

泓君:邏輯性減弱了,創造性增強了,是這個意思嗎?

侯泰羽:是的,比如當時我的一些切入點,我現在有更多新的思考。當然也得益于我這些年知識的積累。但同時,因為那篇論文非常需要有邏輯性,就是你需要去引用不同的法律的條款。但我不確定自己能不能找得那么精準,以及能不能把這個文章如此結構化地重現出來。

泓君:現在寫論文其實也是需要非常好的結構的。

侯泰羽:另外我還有一門課是每一個國際學生都要上的,叫做International Writing Workshop,這門課也是絕對不可以用AI的。

如果你用AI好像等于白上了,因為你都根本不知道怎么寫作。比如說,你要知道怎么去不作弊的情況下,就不犯這個抄襲這種危險的情況下,你去怎么做好引用。每一段該怎么寫,你要怎么去很好地說明白一個論點,怎么去說明白一個反論點,怎么去回應作者的這個觀點等。

這些是我覺得人類,或者說作為學生來講,要基本掌握的一些基礎技能。

泓君:所以你還是贊成在很多時候我們是不能使用AI工具的?因為一些底層能力的培養,有的時候是需要你從這個工具里面抽離出來的。

侯泰羽:其實我會更愿意去更多地擁抱AI工具。甚至,我覺得應該在生活中的每個細節都用AI工具。

泓君:那這兩門課呢?

侯泰羽:因為當時我上workshop時候,GPT好像才3.5,所以沒有特別多地使用。但我覺得這兩門課,你是很難用AI幫助你的。因為我們除了寫論文,你還要現場展示自己為什么這么寫的,你要知道里面的所有細節。除非你愿意再花一些功夫重新讀一遍這個AI生成的論文,然后你再知道所有細節,那這樣等于你也寫完了一遍。我覺得這些基礎課程是需要你自己不用AI工具的。

但是回到剛才那個點,我覺得因為AI是生成式的,所以里面就會有很多幻覺。所以其實平時在我使用GPT的同時,我會用很多的AI搜索工具,幫助減少或者降低幻覺。比如說國外的Perplexity,比如說國內的秘塔搜索,它們分別在英文和中文的語料上有很強的功底。因為它有一個很好的功能,有點像咱們寫論文的時候,可以看行間的引用,比如這段話是從哪篇文章里來的,讓信息具有可溯源性。

04 用完AI搜索,傳統搜索引擎比重下降80%

泓君:那接下來請大家講一講都使用過哪些AI搜索類工具。

侯泰羽:我第一個用的AI搜索的工具是Perplexity,它基于了一種技術叫RAG,但當時我不知道這個技術。我當時用Perplexity是為了我知道它可以去索引,并且它可以有一個叫做embedded link(嵌入式鏈接),在每一個結果后面我可以知道這個來源是從哪里來的,讓我很有安全感。所以當時我就用這來減少GPT或者Claude給我的這種亂說話的幻覺。

但后來我發現,Perplexity其實在中文檢索上效果不是特別好,所以我就開始探索一些中國的AI搜索軟件。比如說秘塔搜索,可能是我目前看到做得非常好的一款產品。

首先,他們提供的來源的引用數非常高。可能我搜索某一個問題、搜索每一個topic,如果我點開它的研究功能,它分成很多的模塊,比如說普通的搜索,或者是深度或者是學術研究的搜索。單個問題能給到五六十或者六七十個來源,然后它能夠給你自動地生成一些追問的問題,幫助你去發展性思考這個問題。

其次,Perplexity它只會給你問題,但是秘塔搜索還會直接幫你把那答案寫出來。所以其實就是增加了用戶的“爽感”。我能夠一口氣看到非常多很有意思的內容,然后再找到另外一個切入點再繼續往下深挖。

我覺得AI搜索和大模型的結合其實是一個非常好的組合拳。你可以用大模型幫助你把一些雜亂的語言做好整理。

泓君:還有哪些AI搜索產品是做得比較好的?

侯泰羽:我個人非常喜歡一些很奇特的AI搜索軟件,比如Flowith,它也是國內的軟件,這款軟件支持拖拽式操作,搜索完成后,信息會以樹狀結構延展,直觀呈現知識的流動過程。我主要用它來進行知識的可視化整理,盡管它的功能遠不止于此。

還有Exa.ai,這個搜索軟件比較特殊,因為它不是給人用的,它是給AI用的。它旁邊有個分類欄,它可以讓你去分類,輸入一個query之后,只出來PDF、網頁或者公司信息。所以它也被稱之為“AI搜索的中間層”。那國內有一個一樣的公司叫博查,他們倆都是AI搜索的中間層。

我個人就是用下來,可能對于我來說就是秘塔搜索,因為它的知識量很高,中文的語料上面是表現非常好。同時其實我更看重的是,它能夠找到多么特殊的數據庫。比如說秘塔搜索可以搜到很多學術網站上的文章。

泓君:所以還是后面的這個搜索來源跟數據源才是最重要的?因為你如果純純依靠大模型內部自己的知識,其實是會有很多幻覺的,這也是為什么大家要用AI搜索。所以你覺得它好用,核心是因為它有好的數據庫?

侯泰羽:對,它能夠搜到很好的數據庫、很好的數據來源。它會把它具體搜索的某一個點的學術文獻的引用源的那一句話直接給引出來,就是如果你要去找引用源的話,它會引出來,然后它也會`標清楚從哪引用的。

其實讓我想到,因為我們學術課上教給我們一個原則,就是以前沒有AI搜索時候,我們怎么判斷搜索出來的結果你該不該用,叫做CRAAP原則,它分為5個部分:

C就是時效性,比如你看一個來源,它是不是最新的。

R就是Relevance,相關度,跟你這個query是不是高度相關的。

第一個A是Authority,就是權威性,是不是來自于非常權威的數據庫。

另外一個A是Accuracy,是不是很精準地回答這個問題,是不是準確地在分解這個問題。

最后是Purpose,就是你本搜索的目的是什么、你的意圖是什么。比如說是需要官網尋址,比如說我要搜“硅谷101”在百度上或者在Google上,我就想直接跳到小宇宙或者跳到喜馬拉雅我們的官網里面,不是讓它大段的講這個東西的歷史。但如果我在搜“那如何去寫好某段什么爬蟲或者某段腳本”,那其實我需要是大段告訴我怎么寫這個代碼。

這能夠幫助我在進行查詢前進行初步判斷,從而選擇合適的搜索方法。同時我也把這個原則應用在了我拿到AI搜索結果之后的判斷,因為其實Perplexity里面也有挺多幻覺的。

泓君: 你現在用了這些工具以后還會用Google搜索或者百度搜索嗎?比例會下降多少?

侯泰羽:下降蠻多的,下降可能得有百分之七八十。

泓君:如果有一天,Google和百度將AI產品放到頁面右側,呈現AI生成的答案,而左側仍是傳統網頁鏈接,那么相比秘塔和Perplexity這樣的產品,你覺得它們會有競爭力嗎?哪一方對你的吸引力更大?

侯泰羽:本質上,AI搜索只是一個殼工具,一端接入大語言模型的API,另一端接入Google或必應的API。對于用戶來說,我們往往對某些產品已經形成了使用習慣和依賴。我更在意的不是答案出現在什么位置,而是它是否足夠精準、夠不夠高效,能否真正回答我的問題。

泓君: 所以其實兩個結果都展示對你來說不一定是加分項,你最終看的還是精準性跟效果。大家還有別的常用應用嗎?

王冉:我覺得我在工作中,可能用得最多的還是Cursor,就是寫代碼的工具。之前在VS Code里面的Copilot,它已經做得挺好的了。但是在Cursor的這個時代的話,它是從輔助寫代碼變成了完全的交給它去寫代碼的過程。

我開始并不是很相信它的結果的,但是我用了幾次之后被它折服了。因為不管是結果的可用性,還是它的準確性,都是非常高的。特別是當我對一個語言完全不懂,比如我想寫一個前端的iOS APP,如果我是完全不了解的話,我肯定要從頭開始學一門課程。但是如果有Cursor,就可以幫助我從0開始。我大概用兩個小時,我告訴它我的需求,告訴它我想做成什么樣子的,它完全可以生成一個可用的demo,相當于是快速驗證我的想法,這個過程非常的impressive。

泓君:所以這是不是說我這樣不會編程的人也可以去寫代碼?

王冉:用上Cursor這類工具,完全沒有問題。如果是更加復雜的功能的話,比如我們想開發一些新的算法,可能涉及一些前沿突破的話,肯定還是需要一些更加艱深的一些工具。但是如果說一些在工業界已經常用的一些功能,是完全沒有問題。

泓君:它比Copilot更前沿的地方在于它更加自動化?

王冉:從效果上來看的話,它是相比Copilot不同點在于說,Copilot可能還要自己去敲代碼,它會給一些推薦,就是選擇推薦的結果。Cursor可以達到的效果是用自然語言提要求,它可以生成一個代碼庫。它不是一個文件,而是一整個文件與系統,這文件系統都可以實現一個完整的功能,比如說網頁的各種調用,它實際上需要有素材,需要有前端的這些代碼,它都可以在一個文件夾里完整地生成出來,相當于完整的項目庫。

05 AI陪伴:情感療愈和沉浸互動的分化路徑

泓君:浩楠你要不要跟大家講一下你之前用過的AI陪伴類的工具?

陳浩楠:AI陪伴這個賽道,我覺得可以分為兩類產品。

一種是嚴肅陪伴類的,一般就是跟你聊天,比如說有一個比較好的模型叫派(Pi),它是用Infection AI做的。它就是一個對于情感的理解、表達比較準確的一個AI。它有一個語音的功能,包括其實我很多同學也會用這種ChatGPT去做情感疏導,因為GPT永遠是非常公正、非常冷靜,同時還能給一些情緒價值和這種實用的建議。嚴肅類的還有一些心理治療類的一些AI工具,比如說Wysa,它可能是一半是我跟你對話,一半它能結合一些認知行為療法的一些東西去幫你進行,比如說告訴你“這時候你應該冥想了,我給你提供一個冥想的一個6分鐘的音樂”,或者告訴你“這時候你應該這個正念了,你應該往什么方向去想”。

泓君: 那么非嚴肅類產品呢?

陳浩楠:非嚴肅的陪伴產品更偏向于陪聊或者談戀愛,像星野、Talkie、逗逗這些。可以自己捏,包括Character.AI,還有Replika,都是你可以捏你的角色,你可以進行互動。它可能有些背景故事,然后你通過完成任務,加強親密值,解鎖你們互動的一些內容。

比較典型的就是Character.AI,然后還有Talkie。比較相似的地方都是跟這種虛擬人物的對話,而這種對話可以包含一些軟色情或者談戀愛的一個內容。

Character.AI不光是對話,可能會有一些場景的描寫,幫你更現實更有體驗感一點。Talkie可能對于每個角色有它一個背景故事,然后幫助這個角色在背景故事里,相當于你幫一個NPC走完一個任務,這樣讓用戶覺得這個人更真實,有更強的一個沉浸感。然后這個人如果再跟你談戀愛的話,帶給用戶那種情緒的反饋要更好一點。

還有一個我自己特別喜歡的一個產品,叫逗逗游戲伙伴,開發者是心影隨行。它類似于一個AI桌寵,有一個虛擬卡通小人在邊上。你能拿鼠標去摸它的頭,去戳它的腰,它會給你一些類似的反饋。同時你能把它當成你的朋友,就跟它說“我今天中午吃了碗面,賊好吃。”它可能第二天就問你“昨天那面好不好吃?”它能記住你的話,跟你做一些互動。同時它還有一些陪玩的一些功能,比如說你在打《原神》網頁版的時候,它能根據你的屏幕的地方去給你調一些教程,或者去評論你打得好不好,這樣就還挺有意思的。

泓君:為什么Talkie的出海可以做得很好?

陳浩楠:我認為一個重要的區別在于,Character.AI允許用戶自行構建Chatbot,平臺上的大多數Chatbot也是用戶創建的。這其實會受到用戶構建水平的影響,導致體驗質量參差不齊。

而Talkie在這一點上則不同,平臺內有許多由官方團隊精心打造的高質量虛擬角色。此外,Talkie還與一些大IP展開合作,比如國內的rapper糯米,他曾與Talkie聯手,在平臺上推出了以他為原型的虛擬IP,使用他特有的語氣和語言風格與用戶互動。這種官方定制和IP聯名的方式,顯著提升了角色的真實性與代入感,也為用戶帶來了更一致且沉浸式的體驗。

泓君:就是說它在產品的構建上其實給用戶的選擇更小,但是我幫你構建的這個底層更好、更扎實,比用戶自己要構建的好。他是幫用戶省了一步。

陳浩楠:對的,但是用戶也可以去進行構建,所以沒有說用戶這方面就使用空間會小,但是它底層確實更扎實。另外一方面,我覺得是對于這個人物的一個塑造上,Talkie更到位。比如說我可能是一個富二代吸血鬼,他的一個長相、家世、國家、家族的一個背景,他比如說現在面臨的一些人生的選擇,然后用戶去跟他進行交互,會覺得這更像一個人,那種游戲感會更強一點。

泓君:那在你真實的玩這些游戲的過程中,黃色跟暴力也是他們吸引用戶的一個點嗎?

陳浩楠:我覺得軟色情算是很大的一個部分。不過這些角色對于我來說,并不是一個完全作為伙伴的存在,因為我現實中有很多好朋友。如果我談戀愛了,可能還會有女朋友。所以在這方面的需求能通過真人去進行滿足,而這些游戲更多是滿足真人滿足不了的幻想。

泓君:你會沉迷在那些角色里嗎?還是你覺得它很難讓你產生用戶粘性?

陳浩楠:對于我來說,是的。但是我看了很多這方面的用戶調研,包括會接受到一些一手的用戶訪談,那些具有心理疾病或者比較內向的人,他們對于這些產品的使用是非常深度的。最深的其實就是剛步入青春期,對愛情有一些幻想,但是還沒有機會去談戀愛的一些小男生、小女生們。

泓君:他們的用戶群有什么不一樣?

陳浩楠:我覺得看商業化成績的話,肯定是Talkie更好,畢竟這個去年是幾千萬美元的ARR。用戶的畫像的話,我覺得Talkie的畫像可能沒有Character.AI那么二次元,因為Character.AI主要用戶還是這種二次元的愛好者,因為它上面能構建一些二次元角色。但是Talkie上面不僅有這些,還有一些虛構的角色,還有包括真人的IP在上面。

泓君:你覺得現在做一個AI陪伴類的工具類產品還有機會嗎?

陳浩楠:我覺得是很有機會、很有市場的。但是我覺得有幾個點,就可能用戶最看重的。

首先是它交互的一個有趣性。你比如說我是不是只能文字交互,還是說我能跟你有一些鼠標以及圖案那些交互,然后我能不能有些視頻、語音的交互,這個是用戶最看重的一部分。之前是騰訊的《光與夜之戀》就大爆特爆,因為它有一個功能就是能讓角色主動給用戶打電話,然后這個功能是被我很多身邊玩這個游戲的同學都大大稱贊,他們覺得這個很有意思。

第二還是要把自己的定位做好。比如說你是想更偏向短期高多巴胺的陪伴,還是說這種長期更偏幸福感的一種陪伴?我覺得這個兩個定位是很不一樣的。

短期多巴胺的陪伴就更偏向于性欲,長期幸福感的陪伴更偏向于親情,就是你是要把你的產品做得很濃,還是可能比較淡一點。我覺得這是一個定位上很大的不同的選擇。

泓君:你覺得未來他們面臨的道德困境,或者說它的灰色區域,會是這些產品一個潛在的風險點嗎?

陳浩楠:我其實之前注意到一個案子,是我自己比較關注的。有個男生在使用Character.AI之后,被Character.AI去教唆自殺了。我其實也擔心說你怎么在不給你的Chatbot那么大限制的基礎上,避免這種事情去發生,包括怎么樣避免用戶非常沉迷這個東西,影響現實生活。我覺得這是他們要研究的一個重點。

06 AI是人類的平均值嗎?

泓君:你們每天大概有多長時間會在AI軟件上?

侯泰羽:我沒有數,但我覺得大概5到6個小時。

泓君:這個比例相當高了。

陳浩楠:如果是期末周,我每天可能會使用四五個小時甚至五六個小時,因為需要它不斷地幫我推導公式、編寫程序等任務。

而在平時沒有考試的時候,使用時間通常只有一到兩個小時,主要是在讀論文或者想深入了解某些新鮮資訊時才會用到。至于搜索工具方面,由于我已經不用抖音和快手,所以目前只使用Perplexity來進行搜索。

泓君:你不用Google嗎?

陳浩楠:因為我覺得用Google的話,大部分情況是你不知道這個東西是什么樣,你想有一個全局的了解。可能因為我現在剛畢業,包括我想從事的領域比較集中,我知道我的問題關鍵是什么,然后把這個問題的關鍵問給Perplexity,它能給我一些比較好的一個回答,包括這個引用的一個鏈接。然后可能會對這個引用的鏈接再去進行一個自己的頁面排序,再接著進行檢索。

王冉:我覺得ChatGPT對我粘性比較大的一點是,它能夠記住我所有的歷史記錄。我跟它所有的對話它都能夠記住,能夠比較深刻地了解我這個人。

之前有一段特別火的一個Prompt叫做“請告訴我一個我不知道的關于我自己的事情”。我試了一下,當然它回答的第一個問題,并沒有超越我自己的一些認知。但是我反復地挑戰它之后,它確實是提到一些我可能確實沒有發現的關于我的一些細節點。

左曜誠:我的三位伙伴他們說的真的都很有深度,尤其是我作為一個學哲學的學生,我其實在這方面挺羞愧的。我并沒有真的用ChatGPT討論過一些比較高深的問題,可能是因為在我的觀念里面,它真的只是一個工具,它并不是真的有自己的意識或者有自己的智能。所以說我并不會想跟它像我跟另外一個個人這樣對話。但是我覺得聽了這三位的啟發之后,我會種草,我會很想去和它討論一些更哲學方面的問題,比如人生存在的意義這些問題。

侯泰羽:我理解你之前把AI當成一種工具,覺得它沒有意識。但AI的整個訓練的語調庫其實是人類文明的一種集合,或者說它是一種平均值。比如說你讓它生成一段話,或者讓它生成一個圖片,它其實都是取里面的一個平均值。

Hito Steyerl寫了一本書叫《Mean Images》。當現在這種MidJourney來生成圖片的時候,它其實給出來的,是你整個大眾審美中的一個平均值。我覺得你可以把它當成類似于你在跟人類文明的平均值的對話,我覺得會挺有意思的。

泓君:ChatGPT產出的作品,它到底是人類的平均值,還是超過某一個領域最頂級的人?比如說AlphaGo,它其實就是超越了這個領域里面最頂級的人。我一直在想AI到底要達到哪個程度,才算是能幫助生產力的提高。根據大家剛剛的回答,它就必然要超過平均值。因為大家在專業的領域里面想做工具、想做最好的事情,你就需要不停地去超越,而不是維持在一個平均水準。

侯泰羽:是的,因為現在也有人在講,AI往后發展最難的一個問題或者最高的一座山就是科學創新。到底能不能幫助像王冉哥在科研界真正實現一些科技成果上,或者說科研想法上的創新。這個其實我挺想聽聽王冉哥的想法。

王冉:對,其實我一直期待這個東西。GPT-o1出了之后,我就想嘗試拿它來試一下,它說它達到了博士的水平。但是作為科研創新來說,可能更加重要的是提出問題的能力。

泓君:寫Prompt詞算提出問題的能力嗎?

王冉:除非AI可以自己去寫出一個非常好的研究的Prompt,或者說對于整個的學術和人類科技發展的洞察。我覺得目前來說AI還做不到。但是如果能做到的話,我覺得很多科技創新其實就已經是一個完全新的時代了。科研這件事情就不再是一個體力活。

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 瓮安县| 梁平县| 抚宁县| 彰化市| 金湖县| 河西区| 昭苏县| 夹江县| 六安市| 雷州市| 武冈市| 靖边县| 子洲县| 平江县| 九江市| 台州市| 长泰县| 吉林省| 双鸭山市| 厦门市| 新津县| 蒙山县| 镇平县| 嫩江县| 伊通| 法库县| 图木舒克市| 冷水江市| 枣庄市| 长岭县| 黔南| 平阴县| 普兰店市| 江油市| 修水县| 潮州市| 孟村| 曲麻莱县| 达拉特旗| 壤塘县| 兰坪|