對(duì)話好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：刷屏全網(wǎng)的Chat GPT可以和教育擦出什么火花？

2022-12-13 12:13:02發(fā)布來(lái)源：多知網(wǎng) 作者：多知網(wǎng)

　　來(lái)源|多知網(wǎng)

　　作者|多知網(wǎng)

　　圖片來(lái)源|Pexels

　　11月30日， OpenAI發(fā)布了“網(wǎng)紅AI”對(duì)話模型ChatGPT。在過去的兩周，席卷了整個(gè)互聯(lián)網(wǎng)科技圈。

　　起因是美國(guó)人工智能公司OpenAI發(fā)布免費(fèi)機(jī)器人對(duì)話模型ChatGPT(GPT-3.5系列)，模型中首次采用RLHF(從人類反饋中強(qiáng)化學(xué)習(xí))方式。模型目前處于測(cè)試階段，用戶與ChatGPT之間的對(duì)話互動(dòng)包括普通聊天、信息咨詢、撰寫詩(shī)詞作文、修改代碼等。

　　ChatGPT功能看起來(lái)非常全面，被稱作“最強(qiáng)AI(人工智能)”，面世5天已有超過100萬(wàn)用戶注冊(cè)。

　　ChatGPT到底是怎么回事?ChatGPT的很多功能看似可以跟教育領(lǐng)域結(jié)合，未來(lái)是否可以落地呢?對(duì)此，多知網(wǎng)對(duì)話了好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人。

　　以下為對(duì)話實(shí)錄：

　　多知網(wǎng)：ChatGPT的出現(xiàn)是否是AI技術(shù)一個(gè)質(zhì)的突破？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：ChatGPT主要有兩個(gè)亮點(diǎn)：

　　1)ChatGPT跟它的諸多前輩相比，針對(duì)用戶的提問已經(jīng)可以做出讓人眼前一亮的回答，其中的部分回答是能夠?qū)嵸|(zhì)性地幫到用戶。

　　比如，為打工人生成一份體面的周報(bào);為程序員的代碼定位bug，并給出修復(fù)建議等。

　　2)ChatGPT的另一個(gè)亮點(diǎn)是它可以和用戶進(jìn)行多輪對(duì)話，對(duì)話過程非常絲滑，這也是現(xiàn)有的聊天機(jī)器人做不到的。

　　與其他的使用大數(shù)據(jù)量訓(xùn)練出來(lái)的大語(yǔ)言模型一樣，ChatGPT同樣也是經(jīng)過先預(yù)訓(xùn)練，后微調(diào)的過程訓(xùn)練得到的對(duì)話模型。模型的訓(xùn)練采用強(qiáng)化學(xué)習(xí) RLHF(從人類反饋中強(qiáng)化學(xué)習(xí))方式進(jìn)行訓(xùn)練，但是OpenAI這次在數(shù)據(jù)收集策略上與以往的大模型不同。RLHF的學(xué)習(xí)方式類似于Google search的人工反饋迭代機(jī)制，但是顯然這種更新方式長(zhǎng)遠(yuǎn)看更加直接有效。

　　首先，采用有監(jiān)督學(xué)習(xí)訓(xùn)練得到一個(gè)初始模型。人類、AI培訓(xùn)員分別作為用戶和AI，模擬人類和AI之間的對(duì)話。

　　此外，還創(chuàng)建了一個(gè)reward模型，將機(jī)器生成的回復(fù)由人類培訓(xùn)員進(jìn)行篩選，按照質(zhì)量排序，挑出質(zhì)量最優(yōu)的那個(gè)。

　　多知網(wǎng)：如何看待有關(guān)ChatGPT的討論？它目前有哪些想象空間和不足？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人： ChatGPT的問世，讓AIGC(AI-generated content，即AI生產(chǎn)內(nèi)容))再次火爆。僅5天時(shí)間，ChatGPT就有100多萬(wàn)用戶注冊(cè)。這些用戶紛紛在社交網(wǎng)絡(luò)等媒體上曬出"調(diào)戲"聊天機(jī)器人的互動(dòng)，這已經(jīng)成為了互聯(lián)網(wǎng)日常更新的熱梗，他們用它來(lái)寫“小學(xué)生”風(fēng)格的作文、問奇怪的問題，這是在瘋狂探索它的功能“邊界”。

　　但作為底層模型的GPT-3，其實(shí)已經(jīng)誕生兩年了，基于GPT-3的初創(chuàng)公司Jasper新獲得1.25億美元的融資，估值達(dá)到15億美元。與之不同的是，ChatGPT既免費(fèi)，又好用。AIGC的革命早已掀起，當(dāng)AI生成的藝術(shù)變得簡(jiǎn)單、免費(fèi)時(shí)，人類對(duì)此的興趣和意識(shí)也就出現(xiàn)了爆炸式的增長(zhǎng)。

　　ChatGPT是免費(fèi)的，這很關(guān)鍵。ChatGPT的迷人之處在于，它使得OpenAI變成消費(fèi)AI產(chǎn)品的領(lǐng)銜者。另外，英語(yǔ)學(xué)習(xí)平臺(tái)「Speak」獲OpenAI領(lǐng)投2700萬(wàn)美元B輪融資，為對(duì)話式口語(yǔ)練習(xí)提供了新的想象空間。

　　關(guān)于ChatGPT的一些想象空間：

　　ChatGPT的出現(xiàn)，基本宣布了人工智能的對(duì)話模型開始在大范圍、細(xì)粒度問題上給出普遍穩(wěn)妥的答案，簡(jiǎn)單地說，人工智能的大對(duì)話模型可以達(dá)到基本不犯錯(cuò)誤的水平了。

　　現(xiàn)在，研究人員每天都在以飛速的方式向全世界提供著大量新功能，而企業(yè)和產(chǎn)品人員才剛剛開始消化這些新功能。

　　再往前想一步，當(dāng)AI在現(xiàn)實(shí)世界中不再匱乏的時(shí)候，人類是否會(huì)被AI取代?

　　就像馬斯克說的那樣，“我們離強(qiáng)大到危險(xiǎn)的AI不遠(yuǎn)了”。OpenAI明年會(huì)推出更強(qiáng)大的GPT-4模型，據(jù)說可以通過圖靈測(cè)試。

　　多知網(wǎng)：ChatGPT完美嗎？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：答案當(dāng)然是：不。

　　ChatGPT有幾個(gè)致命缺陷：

　　1）輸入不能有錯(cuò)。

　　在使用ChatGPT時(shí)，必須要精確，哪怕是一個(gè)詞的改變，答案都會(huì)完全不同。當(dāng)輸入問題，有時(shí)會(huì)得不到答案，修改輸入后，就會(huì)得到答案。

　　2）無(wú)法推理，也無(wú)法思考。

　　對(duì)此，OpenAI坦承，由于ChatGPT學(xué)習(xí)到的知識(shí)只來(lái)自訓(xùn)練數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律，而不是任何類似人類對(duì)世界復(fù)雜和抽象系統(tǒng)的理解，因此該系統(tǒng)可能偶爾會(huì)產(chǎn)生不正確或誤導(dǎo)性的信息，并可能產(chǎn)生攻擊性或有偏見的內(nèi)容。

　　3）此外，該機(jī)器人對(duì)2021年之后的世界知識(shí)“有限”，對(duì)于某些特定人群的問題也“知之甚少”。(訓(xùn)練數(shù)據(jù)截止到2021年)。

　　多知網(wǎng)：ChatGPT未來(lái)有可能會(huì)開源使用嗎？中國(guó)大陸能夠使用嗎？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：ChatGPT 的背后離不開大模型、大數(shù)據(jù)、大算力。ChatGPT 成為AIGC 里程碑的背后，是算力發(fā)展和數(shù)字時(shí)代形成的大數(shù)據(jù)所共同支持的大模型訓(xùn)練，才能實(shí)現(xiàn)目前的效果。GPT系列的大模型訓(xùn)練基本已經(jīng)形成了算力，數(shù)據(jù)，模型的壟斷趨勢(shì)。要知道，在OpenAI的API上，最大的限制因素就是成本?；贠penAI的收費(fèi)API構(gòu)建的GPT-3系列應(yīng)用在國(guó)外已經(jīng)有300+，國(guó)內(nèi)無(wú)法訪問OpenAI的GPT3服務(wù)，目前中國(guó)大陸用戶無(wú)法注冊(cè)ChatGPT服務(wù)賬號(hào)，對(duì)于OpenAI將來(lái)的開源，持悲觀態(tài)度。

　　不過，Meta（原Facebook）、Google等將來(lái)是可能會(huì)開源同類型模型的。

　　多知網(wǎng)：如果能使用，ChatGPT的一些技術(shù)是否可以應(yīng)用在教育場(chǎng)景中？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：個(gè)人認(rèn)為，ChatGPT可以應(yīng)用在教育的一些場(chǎng)景。教育的場(chǎng)景是多元化的，有語(yǔ)文、歷史等文科，數(shù)理化等理科，編程、科學(xué)等素質(zhì)教育學(xué)科。ChatGPT在文科和素質(zhì)學(xué)科場(chǎng)景下有著不錯(cuò)的應(yīng)用場(chǎng)景，例如語(yǔ)文中的作文素材生成、歷史事件的描述、編程的代碼示例等。然而，數(shù)理化這種需要嚴(yán)密的邏輯推理的學(xué)科，對(duì)對(duì)話的質(zhì)量有著比較苛刻的要求，不然ChatGPT生成的內(nèi)容會(huì)對(duì)學(xué)生的學(xué)習(xí)起到一定的反作用。近期，由于ChatGPT的低質(zhì)量答案，已經(jīng)遭Stack Overflow封禁。因此，在理科方面ChatGPT因?yàn)樽陨頊?zhǔn)確率的原因，發(fā)揮的空間不大。

　　目前，由于老師本身具體知識(shí)對(duì)錯(cuò)的分辨能力，ChatGPT可能對(duì)于老師的工作的效率有提升，特別在備課的素材整理環(huán)節(jié)，取其精華，去其糟粕。對(duì)于學(xué)生，個(gè)人能力的仍有限，ChatGPT對(duì)其是把雙刃劍。

　　多知網(wǎng)：ChatGPT是否有可能取代教育場(chǎng)景的某個(gè)場(chǎng)景？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：以目前ChatGPT的能力，可以融入教育的一些場(chǎng)景，特別是學(xué)生的表達(dá)能力的鍛煉，例如低年級(jí)的寫作等。將ChatGPT與圖像、語(yǔ)音的能力結(jié)合，可以有更好的應(yīng)用場(chǎng)景，例如口語(yǔ)表達(dá)能力練習(xí)，將ChatGPT于語(yǔ)音合成、語(yǔ)音評(píng)測(cè)結(jié)合，和學(xué)生展開多輪對(duì)話，并對(duì)發(fā)音和內(nèi)容作出回饋和點(diǎn)評(píng)。

　　未來(lái)，隨著技術(shù)的不斷突破，ChatGPT的系列進(jìn)階版本，完全可以進(jìn)化成為一個(gè)學(xué)習(xí)中的助教角色，輔助學(xué)生方方面面的學(xué)習(xí)。

　　多知網(wǎng)：當(dāng)前好未來(lái)AI技術(shù)的應(yīng)用已經(jīng)實(shí)現(xiàn)了哪些突破？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：1)智慧教育AI開放平臺(tái)已經(jīng)形成，科技部2030重大專項(xiàng)中，智慧教育平臺(tái)的建設(shè)已經(jīng)形成。

　　2) 在線虛擬助教樣例

　　體驗(yàn)鏈接：https://ai.100tal.com/virtual-assistant

　　多知網(wǎng)：如果AI在教育領(lǐng)域要有質(zhì)的突破需要邁過哪幾個(gè)檻？是數(shù)據(jù)？（有效、精準(zhǔn)）還是其他？

　　好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：AI在教育領(lǐng)域要有質(zhì)的突破，還需要邁過很多個(gè)門檻，算法、算力、數(shù)據(jù)都需要有若干次突破才能達(dá)到所謂的質(zhì)的突破。以算法為例，雖然目前AI算法在各個(gè)領(lǐng)域經(jīng)常取得比較亮眼的結(jié)果，然而，更多的是大力出奇跡的結(jié)果，實(shí)質(zhì)性的算法突破并未走向一條類似“摩爾定律”一樣的可預(yù)測(cè)持續(xù)提升軌道。像ChatGPT使用的Transformer是2017年提出的結(jié)構(gòu)，經(jīng)過了5年在各個(gè)領(lǐng)域遍地開花。單從序列長(zhǎng)度視角來(lái)看，Transformer擅長(zhǎng)搞定3位數(shù)token(0~999)，至多4位數(shù)token(0~9999)，更高位數(shù)的顯然需要更多的技術(shù)突破。另外，目前AI算法僅僅是數(shù)據(jù)驅(qū)動(dòng)的，是統(tǒng)計(jì)機(jī)器學(xué)習(xí)的分支，是歸納法的集大成者。內(nèi)置演繹邏輯的AI模型，能夠進(jìn)行類人推理的突破尚未出現(xiàn)。

商學(xué)院

Open Talk

對(duì)話好未來(lái)AI團(tuán)隊(duì)負(fù)責(zé)人：刷屏全網(wǎng)的Chat GPT可以和教育擦出什么火花？

相關(guān)閱讀