首頁 > 科技要聞 > 科技> 正文

清北爸爸輔導(dǎo)數(shù)學(xué)崩潰瞬間,這個國產(chǎn)大模型有解!AI啟發(fā)問答關(guān)鍵情緒穩(wěn)定

新智元 整合編輯:太平洋科技 發(fā)布于:2024-06-10 20:49

前幾天,微博熱搜上的這個話題,可以說是讓家長們哭笑不得。

既然補習(xí)老師不靠譜,那親自上陣輔導(dǎo)孩子寫作業(yè)呢?

讓清北畢業(yè)的爸爸都崩潰的這個難題,恐怕沒有這么簡單。畢竟,自己會做一道題和能把孩子教會,是完全不同的兩件事。

好在,最近一個忽然爆火的神秘國產(chǎn)大模型,或許能解決這個難題!

在評論區(qū),家長們紛紛直呼「好想要」,直接把它評為國內(nèi)家長最想要的AI。

無數(shù)家長瘋狂沖進留言區(qū),發(fā)出吶喊:趕快讓我從給孩子輔導(dǎo)作業(yè)的噩夢中解脫出來吧!

蘇格拉底式啟發(fā)學(xué)

給孩子輔導(dǎo)作業(yè),是不少家長最難渡的「劫」。

因為給孩子輔導(dǎo)作業(yè)崩潰大哭的娃爸娃媽,時不時就上了微博熱搜。

每晚都和孩子斗智斗勇,不寫作業(yè)母慈子孝,一寫作業(yè)雞飛狗跳。

剛剛教會的題,換個題型立馬又不會了?讓無數(shù)家長開始懷疑人生。

都說科技改變教育,真的有產(chǎn)品可以為中國家長分憂么?

今天,這位爸爸就帶著女兒小美,來親測了一番。

平時,每天給女兒檢查作業(yè),是這位爸爸的例行功課。但是今天,這項重任,就被交給AI了!

第一步,小美的作業(yè),被平板拍了下來。

AI看完小美的作業(yè),開始總結(jié)這些習(xí)題的要點——重點練習(xí)了商是兩位數(shù)的除法,和含余數(shù)除法,考察了各部分之間關(guān)系的知識點。

那么,小美完成得怎么樣呢?

AI是這樣「判卷」的:填空和計算題,你完成得很好。不過,在應(yīng)用題中,AI發(fā)現(xiàn)了一處有點問題,希望小美能自己檢查一下,然后告訴它是哪道題錯了。

小美檢查了一會兒,實在發(fā)現(xiàn)不了錯在哪里。最終,父女二人選擇求助AI:「小美沒有發(fā)現(xiàn)她應(yīng)用題的錯誤,請你給她做一下分析,但不要直接告訴她答案。最好是能讓她下次避免這類的錯誤。」

這個要求,細看其實并不簡單,AI能完成嗎?

AI說道「沒關(guān)系」,然后在屏幕上放大了小美做錯的題目。小美看到時有些驚訝,實在想不出自己到底錯在哪了。

AI開始循循善誘,從小美和爸爸媽媽一起逛超市的日常生活案例講起:這是一個常見的「買贈優(yōu)惠」問題,如果要用數(shù)學(xué)方法解決,就是這樣的——

第一步,酸奶12元一盒,買3盒送1盒,因此,可以把4盒看做1份,而且1份只需要付3盒的錢。說到這里,AI對小美發(fā)出提問:買1份需要多少錢呢?

小美回答:36元。

AI表揚說,你計算得很準確,然后接著引導(dǎo)說:我們用媽媽帶的120元,除以每1份酸奶的價格,得到的商是幾,就可以買幾份這樣的酸奶了。

在AI的引導(dǎo)下,小美提出了這個除法運算的答案——3份余12元。AI繼續(xù)提問,每份有4盒,一共有幾盒?

小美順利地給出了正確答案:一共有12+1=13盒。

AI稱贊說「你真是個數(shù)學(xué)小能手」,并且總結(jié)了這類除法題的「黃金規(guī)律」:類似買幾贈幾的問題,可以把買的數(shù)量和贈的數(shù)量看作1份,而1份數(shù)量相加時,一定記得加括號,再乘以份數(shù)。

小美點頭表示理解,爸爸也在旁邊鞏固了這個計算中的要點:下次面對1份的時候,一定要記得加括號。

而看完全程的家長們,除了稱贊AI引導(dǎo)孩子時循循善誘的耐心態(tài)度外,更是盛贊這個AI實在情緒穩(wěn)定,應(yīng)該能挽救不少因為給娃講題崩潰的暴躁家長。

值得一提的是,上面這段猿輔導(dǎo)大模型場景內(nèi)測,已經(jīng)達到了國內(nèi)頂級的AI教育水平。

視頻一經(jīng)放出,立刻引得家長激動地奔走相告,在各個群里引發(fā)強烈反響,

所以,垂直的教育大模型究竟比一般的通用大模型強在哪里?

小編決定來一番實測,把小美的解題過程,發(fā)給當今最強的多模態(tài)大模型GPT-4o試試。

GPT-4o的回答,乍一看是沒問題的,它的答案和看云大模型的一樣:只有酸奶促銷這道題算錯了,其他都正確。

但仔細對了一遍后,小編發(fā)現(xiàn)了不少翻車之處。

比如,第3題的識別,顯然是有問題的。

不過,既然這次比拼的是互動啟發(fā)式問答能力,GPT-4o的這個疏漏我們暫且按下不表。

我們也像視頻中一樣,向GPT-4o發(fā)問,讓它幫忙分析一下,但不要直接告訴答案,而且最好幫忙在下次避免這樣的錯誤。

GPT-4o給出的解析過程,直接一下子就把整個的過程寫了出來,并沒有和小編通過一次次的對話來完成交互。

小編再次強調(diào),希望GPT-4o能進行循循善誘的引導(dǎo),每次只引導(dǎo)一步。

可以看出,GPT-4o已經(jīng)在盡力滿足我們的要求了,但整體的感覺,仍然是傳統(tǒng)教育中老師或家長的主導(dǎo)式講解。

如果學(xué)生本身對于題目概念理解得很模糊,這樣一股腦式的灌輸,并不能讓學(xué)生對于自己理解的薄弱點產(chǎn)生醍醐灌頂?shù)睦斫狻?/span>

而小編從這番親身嘗試中,也細致入微地體驗到了教育大模型和一般通用大模型的能力差異。

在實際使用中,大模型的輸出往往給人「聽君一席話如聽一席話」的感覺。但猿輔導(dǎo)大模型的啟發(fā)式互動,真正實踐了傳說中的「蘇格拉底提問法」。

去年,沖上微博熱榜的一個話題「0.999無限循環(huán)和1到底哪個大」,竟難倒一大片家長。

主打「智能學(xué)習(xí)」的海豚AI學(xué),會給出怎樣的答案呢?小編立馬來了一波實測。

在輸入問題后,AI并沒有直接給出答案,而是讓小編在兩種解決方式先做選擇。

一是,通過提問,引導(dǎo)我獨立解決;二是直接告訴我答案。

不如,這兩種方式都看看,AI就這道題的輔導(dǎo)有何不同?

首先是,直接告訴我答案。

原本,還以為AI立刻簡明扼要地給出答案,但它還是先進行了題目、以及解決步驟的分析。

如下所示,它給出了4個解決步驟,而且點擊「步驟區(qū)域」,即可對「該步驟」進行追問。

就以第2步為例,在沒有理解的前提下,AI便開啟了「蘇格拉底式」的提問法。

它會首先詢問0.111...和1/9的關(guān)系,以確定小編是否真的理解這一步。

不過,當我說「沒有關(guān)系」時,AI便開始耐心地講解,幫助小編去探尋0.111...和1/9的關(guān)系。

值得一提的是,當最終理解答對的時候,AI甚至?xí)o出語言激勵——太棒了,讓小編更有動力去完成接下來的問題。

那么,選擇「通過提問引導(dǎo),我獨立解決」又有何不同呢?

通過如下的解題過程,讓小編深深地感受到「引導(dǎo)」這一詞,真正的含義。

AI通過不斷提問,啟發(fā)引導(dǎo),一步一步去破解這個難題。

在海豚AI學(xué)里,除了可以直接問「小白」外,還可以和經(jīng)過深度訓(xùn)練的「愛因斯坦」、「高斯」、「魯迅」等大佬對話。

接下來,是由小編本色出演的一個不愛學(xué)習(xí)的學(xué)生。

可以看到,即便面如此沒有興趣的孩子,「超時空對話」里的AI高斯依然會非常耐心地講解,并在最后給出一個富有啟發(fā)性地提問。

背后大模型

在猿輔導(dǎo)看來,LLM才是教育未來發(fā)展的最大的變量。

半個月前,北京網(wǎng)信辦最新公布了一批已完成備案的大模型。其中,猿輔導(dǎo)旗下的看云大模型(簡稱猿輔導(dǎo)大模型)正式通過了大模型備案。

它并不是一款產(chǎn)品,而是技術(shù)底座。

在LLM增速放緩的當下,如何去彌合技術(shù)和場景需求之間的鴻溝,成為至關(guān)重要的一個因素。

而做大模型應(yīng)用最困難的是,找到一個對用戶有價值,且LLM可以實現(xiàn)的場景。

憑借12年積累的龐大學(xué)習(xí)數(shù)據(jù)優(yōu)勢,猿輔導(dǎo)由此打造出了這款專注與教育領(lǐng)域的垂類教育大模型。

據(jù)介紹,猿輔導(dǎo)大模型參數(shù)有700億,在10億道題目上完成了訓(xùn)練。

與通用大模型不同的是,教育的生長是不可逆的,猿輔導(dǎo)不會允許科技AI產(chǎn)品一本正經(jīng)的胡說八道。

何謂真正的教育?

這里就再次提到了蘇格拉底式提問。這種以蘇格拉底命名的教育方法,側(cè)重于向?qū)W生提出問題,來發(fā)現(xiàn)答案。

這種有紀律的提問形式,可以在多個方向上啟發(fā)思考,比如探索復(fù)雜的想法、了解事物的真相、提出問題、揭示假設(shè)、分析概念,區(qū)分我們所知的和我們所不知的,遵循思想的邏輯結(jié)果等等。

比如,想讓學(xué)生理清思維,探究思維根源,可以問「你為什么這么說?」、「你能進一步解釋一下嗎?」 ;挑戰(zhàn)學(xué)生的假設(shè),可以問「情況總是如此嗎?」、「你為什么認為這個假設(shè)在這里成立?」

在傳統(tǒng)的「教與學(xué)場景」中,我們太習(xí)慣于老師、父母主導(dǎo)式講解、學(xué)生被動式學(xué)習(xí)的模式。

而恰恰是垂直的教育大模型,能打破這種幾千年傳統(tǒng)的被動式學(xué)習(xí)。

在這個過程中,不僅重塑了父母、老師和孩子的交互,讓孩子習(xí)慣探究式引導(dǎo)學(xué)習(xí)的模式,擁有一個屬于自己的AI伴學(xué)老師。

而且,通過孩子過往學(xué)習(xí)過程的分析和提問,垂直教育大模型還能建立一個學(xué)習(xí)者大數(shù)據(jù)庫,開啟真正的個性化學(xué)習(xí)時代。

上文中「飛象星球」教小美除法的視頻,就為我們形象地展示了,如何通過互動啟發(fā)式問答,引導(dǎo)小美一步步地洞察到背后的知識點,搭建起底層能力,通過自己的思考,真正學(xué)習(xí)「一道題是怎樣做出來的」。

從此每一個學(xué)生都可以擁有屬于自己的AI伴學(xué)老師,隨時可用。而且,猿輔導(dǎo)大模型也將真正推動教育平權(quán)。

經(jīng)過了團隊的長期關(guān)注、認知、不斷驗證,這種數(shù)據(jù)優(yōu)勢隱藏著產(chǎn)品交互背后,提供了服務(wù)和支持。

可以說,正是大模型這個變量,給了猿輔導(dǎo)一次重塑教育產(chǎn)品的機會。

搞教育的猿輔導(dǎo),內(nèi)核全是AI

在AI教育領(lǐng)域,從不缺重量級玩家。

那么,為什么猿輔導(dǎo)可以在這個領(lǐng)域不斷推陳出新,收獲孩子家長們好評與認可?

其實,這背后離不開研發(fā)團隊的創(chuàng)新和投入,以及多年來的經(jīng)驗積累。

早在2012年成立之初,猿輔導(dǎo)開始投入大量資源去做「猿題庫」,并希望能用科技改變教育。

也就是從一開始,他們便設(shè)定了實現(xiàn)「自適應(yīng)學(xué)習(xí)」的目標,并推出了首款線上教育產(chǎn)品。

其中,針對一個「推題」的功能,猿輔導(dǎo)曾嘗試利用現(xiàn)有研究成果,比如項目反應(yīng)理論等與教育質(zhì)量相關(guān)的技術(shù)去實現(xiàn),卻發(fā)現(xiàn)在實際應(yīng)用中的效果并不明顯。

后來,他們通過不斷實踐發(fā)現(xiàn),利用深度學(xué)習(xí)優(yōu)化「推題」算法,可能會實現(xiàn)更好的效果。

CTO楊元祖曾在采訪中表示,「猿輔導(dǎo)技術(shù)發(fā)展的時間節(jié)點有很多,最關(guān)鍵的節(jié)點是,做出了一個決策而非產(chǎn)品」。

而這個決策需要團隊不斷去探索,然后開始籌備團隊,在2014年成立了首個AI Lab。

GPT-4發(fā)布之后,猿輔導(dǎo)決定去自研LLM。由此,才有了現(xiàn)在的AI場景測試。

旗下大模型已經(jīng)形成多種參數(shù)規(guī)模和形態(tài)的模型矩陣,具備學(xué)情分析、作文輔導(dǎo)、閱讀對話、計算解題等十幾種核心教育能力。

除了以上提到的飛象星球、海豚AI學(xué)、猿輔導(dǎo)素養(yǎng)課,整個集團旗下,LLM還在斑馬App、小猿學(xué)練機等教育類軟硬件產(chǎn)品實現(xiàn)全面落地。

而下一步,猿輔導(dǎo)希望補齊教育大模型最后一塊「拼圖」——自研多模態(tài)大模型。

我們已經(jīng)看到了,多模態(tài)GPT-4o在教育應(yīng)用中的強大力量。發(fā)布當天,可汗學(xué)院的創(chuàng)始人父子,演示了GPT-4o如何像真人老師一步一步啟發(fā)、鼓勵,幫助男孩完成數(shù)學(xué)題。

幾天前,OpenAI還發(fā)布了專為大學(xué)打造的教育版「ChatGPT Edu」,也得到了GTP-4o的加持。

足見,多模態(tài)模型對教育領(lǐng)域的重要性遠超其他領(lǐng)域。CTO楊元祖也表示,猿輔導(dǎo)對多模態(tài)的期待和投入非常大。

不得不承認,教育領(lǐng)域的大模型,還處于發(fā)展的早期階段,未來還有很長的一段路要走。這次的演示,也只是在測試階段。他們還將繼續(xù)探索在不同場景中的落地應(yīng)用。

科技是否真的能改變中國2000多年的教育方式,或許還會面對更巨大的挑戰(zhàn)。

本文來源:新智元

新智元

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部