ChatGPT的迷人之處在于,它使得OpenAI變成消費AI產(chǎn)品的領(lǐng)銜者。

對話好未來AI團隊負責人:刷屏全網(wǎng)的Chat GPT可以和教育擦出什么火花?

2022-12-13 12:13:02發(fā)布     來源:多知網(wǎng)    作者:多知網(wǎng)  

  來源|多知網(wǎng)

  作者|多知網(wǎng)

  圖片來源|Pexels

  11月30日, OpenAI發(fā)布了“網(wǎng)紅AI”對話模型ChatGPT。在過去的兩周,席卷了整個互聯(lián)網(wǎng)科技圈。

  起因是美國人工智能公司OpenAI發(fā)布免費機器人對話模型ChatGPT(GPT-3.5系列),模型中首次采用RLHF(從人類反饋中強化學(xué)習(xí))方式。模型目前處于測試階段,用戶與ChatGPT之間的對話互動包括普通聊天、信息咨詢、撰寫詩詞作文、修改代碼等。

  ChatGPT功能看起來非常全面,被稱作“最強AI(人工智能)”,面世5天已有超過100萬用戶注冊。

  ChatGPT到底是怎么回事?ChatGPT的很多功能看似可以跟教育領(lǐng)域結(jié)合,未來是否可以落地呢?對此,多知網(wǎng)對話了好未來AI團隊負責人。

  以下為對話實錄:

  多知網(wǎng):ChatGPT的出現(xiàn)是否是AI技術(shù)一個質(zhì)的突破?

  好未來AI團隊負責人:ChatGPT主要有兩個亮點:

  1)ChatGPT跟它的諸多前輩相比,針對用戶的提問已經(jīng)可以做出讓人眼前一亮的回答,其中的部分回答是能夠?qū)嵸|(zhì)性地幫到用戶。

  比如,為打工人生成一份體面的周報;為程序員的代碼定位bug,并給出修復(fù)建議等。

  2)ChatGPT的另一個亮點是它可以和用戶進行多輪對話,對話過程非常絲滑,這也是現(xiàn)有的聊天機器人做不到的。

  與其他的使用大數(shù)據(jù)量訓(xùn)練出來的大語言模型一樣,ChatGPT同樣也是經(jīng)過先預(yù)訓(xùn)練,后微調(diào)的過程訓(xùn)練得到的對話模型。模型的訓(xùn)練采用強化學(xué)習(xí) RLHF(從人類反饋中強化學(xué)習(xí))方式進行訓(xùn)練,但是OpenAI這次在數(shù)據(jù)收集策略上與以往的大模型不同。RLHF的學(xué)習(xí)方式類似于Google search的人工反饋迭代機制,但是顯然這種更新方式長遠看更加直接有效。

  首先,采用有監(jiān)督學(xué)習(xí)訓(xùn)練得到一個初始模型。人類、AI培訓(xùn)員分別作為用戶和AI,模擬人類和AI之間的對話。

  此外,還創(chuàng)建了一個reward模型,將機器生成的回復(fù)由人類培訓(xùn)員進行篩選,按照質(zhì)量排序,挑出質(zhì)量最優(yōu)的那個。

  多知網(wǎng):如何看待有關(guān)ChatGPT的討論?它目前有哪些想象空間和不足?

  好未來AI團隊負責人: ChatGPT的問世,讓AIGC(AI-generated content,即AI生產(chǎn)內(nèi)容))再次火爆。僅5天時間,ChatGPT就有100多萬用戶注冊。這些用戶紛紛在社交網(wǎng)絡(luò)等媒體上曬出"調(diào)戲"聊天機器人的互動,這已經(jīng)成為了互聯(lián)網(wǎng)日常更新的熱梗,他們用它來寫“小學(xué)生”風(fēng)格的作文、問奇怪的問題,這是在瘋狂探索它的功能“邊界”。

  但作為底層模型的GPT-3,其實已經(jīng)誕生兩年了,基于GPT-3的初創(chuàng)公司Jasper新獲得1.25億美元的融資,估值達到15億美元。與之不同的是,ChatGPT既免費,又好用。AIGC的革命早已掀起,當AI生成的藝術(shù)變得簡單、免費時,人類對此的興趣和意識也就出現(xiàn)了爆炸式的增長。

  ChatGPT是免費的,這很關(guān)鍵。ChatGPT的迷人之處在于,它使得OpenAI變成消費AI產(chǎn)品的領(lǐng)銜者。另外,英語學(xué)習(xí)平臺「Speak」獲OpenAI領(lǐng)投2700萬美元B輪融資,為對話式口語練習(xí)提供了新的想象空間。

  關(guān)于ChatGPT的一些想象空間:

  ChatGPT的出現(xiàn),基本宣布了人工智能的對話模型開始在大范圍、細粒度問題上給出普遍穩(wěn)妥的答案,簡單地說,人工智能的大對話模型可以達到基本不犯錯誤的水平了。

  現(xiàn)在,研究人員每天都在以飛速的方式向全世界提供著大量新功能,而企業(yè)和產(chǎn)品人員才剛剛開始消化這些新功能。

  再往前想一步,當AI在現(xiàn)實世界中不再匱乏的時候,人類是否會被AI取代?

  就像馬斯克說的那樣,“我們離強大到危險的AI不遠了”。OpenAI明年會推出更強大的GPT-4模型,據(jù)說可以通過圖靈測試。

  多知網(wǎng):ChatGPT完美嗎?

  好未來AI團隊負責人:答案當然是:不。

  ChatGPT有幾個致命缺陷:

  1)輸入不能有錯。

  在使用ChatGPT時,必須要精確,哪怕是一個詞的改變,答案都會完全不同。當輸入問題,有時會得不到答案,修改輸入后,就會得到答案。

  2)無法推理,也無法思考。

  對此,OpenAI坦承,由于ChatGPT學(xué)習(xí)到的知識只來自訓(xùn)練數(shù)據(jù)中的統(tǒng)計規(guī)律,而不是任何類似人類對世界復(fù)雜和抽象系統(tǒng)的理解,因此該系統(tǒng)可能偶爾會產(chǎn)生不正確或誤導(dǎo)性的信息,并可能產(chǎn)生攻擊性或有偏見的內(nèi)容。

  3)此外,該機器人對2021年之后的世界知識“有限”,對于某些特定人群的問題也“知之甚少”。(訓(xùn)練數(shù)據(jù)截止到2021年)。

  多知網(wǎng):ChatGPT未來有可能會開源使用嗎?中國大陸能夠使用嗎?

  好未來AI團隊負責人:ChatGPT 的背后離不開大模型、大數(shù)據(jù)、大算力。ChatGPT 成為AIGC 里程碑的背后,是算力發(fā)展和數(shù)字時代形成的大數(shù)據(jù)所共同支持的大模型訓(xùn)練,才能實現(xiàn)目前的效果。GPT系列的大模型訓(xùn)練基本已經(jīng)形成了算力,數(shù)據(jù),模型的壟斷趨勢。要知道,在OpenAI的API上,最大的限制因素就是成本?;贠penAI的收費API構(gòu)建的GPT-3系列應(yīng)用在國外已經(jīng)有300+,國內(nèi)無法訪問OpenAI的GPT3服務(wù),目前中國大陸用戶無法注冊ChatGPT服務(wù)賬號,對于OpenAI將來的開源,持悲觀態(tài)度。

  不過,Meta(原Facebook)、Google等將來是可能會開源同類型模型的。

  多知網(wǎng):如果能使用,ChatGPT的一些技術(shù)是否可以應(yīng)用在教育場景中?

  好未來AI團隊負責人:個人認為,ChatGPT可以應(yīng)用在教育的一些場景。教育的場景是多元化的,有語文、歷史等文科,數(shù)理化等理科,編程、科學(xué)等素質(zhì)教育學(xué)科。ChatGPT在文科和素質(zhì)學(xué)科場景下有著不錯的應(yīng)用場景,例如語文中的作文素材生成、歷史事件的描述、編程的代碼示例等。然而,數(shù)理化這種需要嚴密的邏輯推理的學(xué)科,對對話的質(zhì)量有著比較苛刻的要求,不然ChatGPT生成的內(nèi)容會對學(xué)生的學(xué)習(xí)起到一定的反作用。近期,由于ChatGPT的低質(zhì)量答案,已經(jīng)遭Stack Overflow封禁。因此,在理科方面ChatGPT因為自身準確率的原因,發(fā)揮的空間不大。

  目前,由于老師本身具體知識對錯的分辨能力,ChatGPT可能對于老師的工作的效率有提升,特別在備課的素材整理環(huán)節(jié),取其精華,去其糟粕。對于學(xué)生,個人能力的仍有限,ChatGPT對其是把雙刃劍。

  多知網(wǎng):ChatGPT是否有可能取代教育場景的某個場景?

  好未來AI團隊負責人:以目前ChatGPT的能力,可以融入教育的一些場景,特別是學(xué)生的表達能力的鍛煉,例如低年級的寫作等。將ChatGPT與圖像、語音的能力結(jié)合,可以有更好的應(yīng)用場景,例如口語表達能力練習(xí),將ChatGPT于語音合成、語音評測結(jié)合,和學(xué)生展開多輪對話,并對發(fā)音和內(nèi)容作出回饋和點評。

  未來,隨著技術(shù)的不斷突破,ChatGPT的系列進階版本,完全可以進化成為一個學(xué)習(xí)中的助教角色,輔助學(xué)生方方面面的學(xué)習(xí)。

  多知網(wǎng):當前好未來AI技術(shù)的應(yīng)用已經(jīng)實現(xiàn)了哪些突破?

  好未來AI團隊負責人:1)智慧教育AI開放平臺已經(jīng)形成,科技部2030重大專項中,智慧教育平臺的建設(shè)已經(jīng)形成。

  2) 在線虛擬助教樣例

  體驗鏈接:https://ai.100tal.com/virtual-assistant

  多知網(wǎng):如果AI在教育領(lǐng)域要有質(zhì)的突破 需要邁過哪幾個檻?是數(shù)據(jù)?(有效、精準)還是其他?

  好未來AI團隊負責人:AI在教育領(lǐng)域要有質(zhì)的突破,還需要邁過很多個門檻,算法、算力、數(shù)據(jù)都需要有若干次突破才能達到所謂的質(zhì)的突破。以算法為例,雖然目前AI算法在各個領(lǐng)域經(jīng)常取得比較亮眼的結(jié)果,然而,更多的是大力出奇跡的結(jié)果,實質(zhì)性的算法突破并未走向一條類似“摩爾定律”一樣的可預(yù)測持續(xù)提升軌道。像ChatGPT使用的Transformer是2017年提出的結(jié)構(gòu),經(jīng)過了5年在各個領(lǐng)域遍地開花。單從序列長度視角來看,Transformer擅長搞定3位數(shù)token(0~999),至多4位數(shù)token(0~9999),更高位數(shù)的顯然需要更多的技術(shù)突破。另外,目前AI算法僅僅是數(shù)據(jù)驅(qū)動的,是統(tǒng)計機器學(xué)習(xí)的分支,是歸納法的集大成者。內(nèi)置演繹邏輯的AI模型,能夠進行類人推理的突破尚未出現(xiàn)。