“不要期待有了AI之后就能一劍封喉?!?/p>

對話高途聯(lián)創(chuàng)羅斌:教育公司要想在應(yīng)用AI層改變格局,至少需要3-5年的周期

2025-02-14 10:44:00發(fā)布     來源:多知    作者:徐晶晶  

  來源|多知

  作者|徐晶晶

  興奮。

  未知。

  這是高途聯(lián)合創(chuàng)始人羅斌面對當(dāng)下DeepSeek引發(fā)的這一輪AI技術(shù)浪潮時的心境。

  興奮,是因為看得見的確定性,“拉長周期來看,DeepSeek帶來了巨大的變量,創(chuàng)造了新的可能性。”

  不過,這份確定性又是模糊的、未知的。“大致方向是能看得見的,但是整個路徑、節(jié)奏是模糊的、非共識的,這其中存在很大的不確定性和未知性。這也意味著,一種壓力。”

  2月12日,高途正式宣布接入DeepSeek大模型,不過,其對DeepSeek的關(guān)注要比后者大范圍步入公眾視野更早。

  高途透露了接入DeepSeek后帶來的一些顯著變化:

  比如,內(nèi)部協(xié)同工具AI助手在接入后,截至目前,日訪問量提升了200%,預(yù)計在2月中旬完成內(nèi)部業(yè)務(wù)系統(tǒng)和協(xié)作平臺全面打通之后,訪問量將會進一步增加。

  再比如,在用戶產(chǎn)品側(cè),以DeepSeek為技術(shù)核心的高中數(shù)學(xué)測評準確率提升了15%,而后高中AI選科規(guī)劃服務(wù)也借由AI助力實現(xiàn)了服務(wù)質(zhì)量提高。

  在高途官宣接入的當(dāng)天,多知就DeepSeek相關(guān)話題對話了高途聯(lián)合創(chuàng)始人羅斌。

  羅斌嚴謹?shù)亟o出了一些判斷和預(yù)期:

  1.DeepSeek-R1大模型的準確率已達到在教育場景相對可用的狀態(tài)。

  2.今天的大模型還處在整個AI能力進化的相對早期階段,如果成熟狀態(tài)是100分,那么今天的這些大模型最好的狀態(tài)也就是5-10分的水平,離終態(tài)還很遙遠。

  3.在基座模型不斷迭代時,對每家公司來說,更重要的是要找到一種機制,以便在大廠的基座模型快速迭代的過程中,能及時跟上這一波變化,并在每次變化的過程中,能及時把新的能力結(jié)合進來,為自己所用。

  4.回到教育這個場景,至少在我們現(xiàn)在能看見的一個周期內(nèi),AI能力本身是一個關(guān)鍵要素,但不是一個決定性的要素。不要期待有了AI之后就能一劍封喉。

  5.如果有了更強大的大模型能力,過去拍搜的這種模式就會發(fā)生變化,就不需要提前去生產(chǎn)積累自己的題庫,現(xiàn)在是一種實時解答的方式,通過大模型就能夠達到一個非常高的準確率了。

  6.教育AI的iPhone時刻一定會發(fā)生,但時間、形式不確定。教育公司要想在應(yīng)用AI層面改變格局,至少需要3-5年的周期。

  7.眾多學(xué)習(xí)環(huán)節(jié)里,AI能替代的,其一,是一個相對簡單的學(xué)習(xí)任務(wù)。其二,AI更適合于學(xué)生主動來發(fā)起、AI來接聽響應(yīng)的場景。而需要由我們來主動地管理和影響學(xué)生的這個部分,今天的AI還做不到。

  8.小型的創(chuàng)業(yè)公司,在某些單點上、在某些形態(tài)的產(chǎn)品上,有可能獲得一波特殊的機會。但是如果回到重交付、端到端、以學(xué)習(xí)結(jié)果為導(dǎo)向的領(lǐng)域里,這里的機會對于創(chuàng)業(yè)公司而言,挑戰(zhàn)還是非常大的。

  

  01

  DeepSeek-R1大模型的準確率已達到“在教育場景相對可用的狀態(tài)”

  多知:DeepSeek將如何影響教育行業(yè)未來的發(fā)展?會帶來哪些顛覆性的改變?

  羅斌:第一個變化,DeepSeek這波算是完成了一次比較好的市場教育,提升了大眾對于AI能力的關(guān)注度,也讓普通用戶使用AI工具的滲透率得到了提升。

  第二個變化,結(jié)合公開信息和我們內(nèi)部驗證來看,DeepSeek-R1的模型做了一些創(chuàng)新(包括引入了更強的推理能力)后,在一些教育場景下的應(yīng)用效果確實有很大的提升。這種提升意味著,從應(yīng)用的角度來說,它的準確率已經(jīng)達到了一個相對可用的狀態(tài)。

  教育行業(yè)的容錯率比較低。原來,大模型的準確率并沒有達到可用狀態(tài)。但是今天,以DeepSeek-R1為代表的這些模型的能力迅速提升,讓整個可用性變得更高,也讓更多的場景引入這一大模型的能力變得更加可行。

  舉例來說,在我們內(nèi)部高中數(shù)學(xué)的一個題庫上,之前我們用原有模型測試,準確率最佳情況是能做到74%。我們現(xiàn)在拿DeepSeek-R1結(jié)合內(nèi)部級數(shù)據(jù)測了一下,經(jīng)過調(diào)優(yōu)之后,準確率大概能到90%。這還是其在高中數(shù)學(xué)的知識體系里的表現(xiàn)。如果知識點下沉到初中、小學(xué),DeepSeek-R1的準確率會提升得更顯著,可能接近于真人的狀態(tài)。

  第三個變化,讓更多企業(yè)堅定了對AI的投入。之前很多企業(yè)對AI還沒有形成很好的共識,畢竟AI的投入成本比較高,也需要專業(yè)人才。但今天很多企業(yè)意識到了,必須要擁抱AI。

  回到教育場景下,它可能會帶來的變化主要是在兩個方向:

  一個方向是為學(xué)生創(chuàng)造更好的價值。

  從產(chǎn)品的角度來講,目前行業(yè)里的教學(xué)環(huán)境,大部分還是通過以真人老師為主來跟學(xué)生進行交付。有了DeepSeek能力的輔助后,老師和學(xué)生在整個教學(xué)過程中的反應(yīng)的速度、平均的專業(yè)度、效率、服務(wù)群體的規(guī)模,都能得到大幅提升。

  這帶來的一個變化是,原來必須要由專業(yè)的真人老師來提供一些教學(xué)服務(wù),今天通過大模型的輔助,不管是教學(xué)、練習(xí)還是答疑,直接通過AI To C或者通過AI輔助老師來To C這兩種情況下,整個效果和效率都能夠有顯著的提升。

  另一個方向是改善企業(yè)內(nèi)部的運營效率。不管是市場營銷、銷售轉(zhuǎn)化或服務(wù)的環(huán)節(jié),效率都會有顯著提升。

  必須要明確的是,雖然以DeepSeek為代表的大模型現(xiàn)在很火,但是總體來講,它們還是在整個AI能力進化的相對早期階段,如果成熟狀態(tài)是100分,那么今天的這些大模型最好的狀態(tài)也就是5-10分的水平,離終態(tài)還很遙遠,在短周期內(nèi),我們還不能對它的節(jié)奏和價值期待過高。

  02

  在基座模型快速迭代的過程中,教育公司也要讓自有模型及時跟上變化

  多知:市面上很多教育公司已經(jīng)有自研的大模型,同時接入了DeepSeek,怎么看其未來的路徑?

  羅斌:如今,DeepSeek是一個更強大的基座模型,無論是把自己原有的模型或數(shù)據(jù)和DeepSeek結(jié)合,還是以DeepSeek模型作為基座,重新去訓(xùn)練新的自有模型,每家公司會用不同的路徑來做。

  但我的基本觀點是,今天大模型的底層生態(tài),如果只是5-10分的水平,那么在未來的半年、一年、兩年、三年,底層的大模型還會有突飛猛進的變化。

  今天各家在這樣的場景下構(gòu)建起的自有模型的能力提升速度,跟大廠的模型提升速度相比,完全不在一個量級。

  在這種情況下,對每家公司來說,更重要的是要找到一種機制,以便在大廠的基座模型快速迭代的過程中,能及時跟上這一波變化,并在每次變化的過程中,能及時把新的能力能結(jié)合進來,為自己所用。

  03

  不要期待有了AI之后就能一劍封喉

  多知:當(dāng)教育公司普遍擁抱DeepSeek,大家的差異化、本質(zhì)區(qū)別將體現(xiàn)在哪里?

  羅斌:不管是以DeepSeek為代表開源的基座模型,還是一些大廠的閉源模型,它都會有某種方式開放給整個社會使用。所以在底層的基礎(chǔ)的能力上,是相對標(biāo)化的、是平等的,大家在這個地方不會有明顯的差異。

  但可能會存在差異的地方是什么呢?

  第一個維度就是在模型的本身。

  各家根據(jù)自己的需要,嘗試建垂直模型、小模型或者專屬模型,這樣能更好地適配不同應(yīng)用場景。比如高途有考研業(yè)務(wù),也有公考業(yè)務(wù),可能用于考研業(yè)務(wù)的模型和用于考公業(yè)務(wù)的模型就不太一樣。這里可能存在差異化的模型的版本。

  各家在專屬模型的建設(shè)能力和水平上實際上是有差異的。

  第二個維度是在應(yīng)用層。

  關(guān)于基座模型,教育公司們不會有顯著的差異。但在應(yīng)用層,可能變化會更多一些。現(xiàn)在的模型,更多的還是偏系統(tǒng)1的這種模型,還不具備非常強的推理、調(diào)度或者真正意義上的智能。

  未來,大家也在提,比如大套型套小模型的方式,或者是通用模型嵌套專有模型的方式,包括未來有市面上有這么多的模型,怎樣做混用,不同的場景下可能調(diào)用不同的模型,另外,包括人機怎么結(jié)合,老師和AI怎樣協(xié)作,讓整個過程能夠變得更加高效和專業(yè),這個地方可能各家的做法會有差異。

  還有一個就是怎樣做運營。同樣的一個能力,在不同的團隊里面,你的推廣、宣傳、運營,可能會導(dǎo)致最終的使用的廣度、深度、效果上,也會有明顯的差距。

  第三個維度是在產(chǎn)品層。

  站在學(xué)員的角度,學(xué)員需要的產(chǎn)品是一個解決方案。他并沒有那么在意你提供的是真的AI還是別的什么。

  所以結(jié)合AI的能力后,每家提供的解決方案,是不一樣的。但是從學(xué)員角度看,他需要更好的體驗,更好的效果和更好的性價比。因此,在產(chǎn)品上,變化會更大。

  最后一個維度是組織能力。

  同樣的一種AI能力,隨著時間的演進,大家的迭代方向和迭代速度是會有差異的。

  拉長周期來看,不管是從產(chǎn)品層面還是從運營層面,都會形成更加明顯的差異。

  這里面,人才的影響是比較大的。

  總結(jié)來講,底層能力、標(biāo)準化的這些能力,大家是類似的。但是回到教育這個場景,至少在我們現(xiàn)在能看見的一個周期內(nèi),AI能力本身是一個關(guān)鍵要素,但不是一個決定性的要素。更重要的還是在產(chǎn)品、在應(yīng)用等方面,可能需要結(jié)合AI來做重新的思考設(shè)計。面向未來的一個周期(3-5年)來做這樣的布局和迭代,可能是更加重要的。

  不要期待有了AI之后就能一劍封喉,這件事情不太會發(fā)生。

  04

  大模型實時解答,正在消解拍搜解題產(chǎn)品的題庫門檻

  羅斌:原來學(xué)生有一道題不會做,他要么問老師,要么就用拍搜工具。拍搜工具內(nèi)部是要做大量題庫的生產(chǎn)和累積的,但今天看起來,如果有了更強大的大模型能力,過去拍搜的這種模式就會發(fā)生變化,就不需要提前去生產(chǎn)積累自己的題庫,現(xiàn)在是一種實時解答的方式。

  所以我的感覺是,未來在解題的這個部分,你問AI一道標(biāo)準化的題,AI給你進行解題這件事,會變得比較標(biāo)準化了,通過大模型就能夠達到一個非常高的準確率了。相當(dāng)于拍搜題庫這件事不會有絕對的門檻了。當(dāng)然可能每一家自己做出來這個模型,通過不同的數(shù)據(jù)和調(diào)優(yōu)以后,可能還會有一定的準確率的差異。但這個差異就沒有那么大了。

  原來可能你手里有一億的題庫,人家手里可能只有一千萬的題庫,差異可能會特別大。但有了更強大的大模型能力,以后可能的差異是,你的準確率可能是93%,人家的準確率可能是91%??赡苤皇沁@種層面的一個區(qū)別。但是在覆蓋率上,可能大家都能夠做到非常高的覆蓋率。

  05

  學(xué)習(xí)環(huán)節(jié)里,相對簡單的任務(wù)和交互,更容易被AI替代

  多知:DeepSeek會不會取代一些現(xiàn)有的學(xué)習(xí)產(chǎn)品?

  羅斌:如果把整個學(xué)習(xí)進行拆解,不管是面向?qū)W生,還是站在企業(yè)內(nèi)部的角度,有很多環(huán)節(jié)。

  哪些環(huán)節(jié)受到AI的影響更大呢?可能是相對簡單的任務(wù),相對簡單的交互,在這種邏輯下,更容易發(fā)生。但如果它是一個長周期的、多任務(wù)的、復(fù)雜的鏈條,AI在里面產(chǎn)生很大作用的難度會比較大一些。

  所以,第一個,AI替代的應(yīng)該是一個相對簡單的這種學(xué)習(xí)任務(wù)。第二個是,它更適合于學(xué)生主動來發(fā)起、AI來接聽響應(yīng)的場景。而需要由我們來主動地管理和影響學(xué)生的這個部分,今天的AI還做不到。這是因為,AI的能力還不夠,也很難讓學(xué)生真正遵從AI的指令。

  所以從這兩個角度來講,AI能夠在里面發(fā)揮作用的一些環(huán)節(jié)還是可以羅列的:

  第一種場景,在企業(yè)內(nèi)部的一個場景下,通過AI來輔助做一些內(nèi)容的生產(chǎn),做一些知識庫的建設(shè),包括做一些內(nèi)部的問答平臺搭建,這是可以做得到的。

  第二種場景,一些簡單的對話場景,比如像客服、拍搜(學(xué)生問一個問題,你要給他一個答案,這種就是用戶過來之后就去尋找一個答案的這樣一種邏輯,跟標(biāo)準化的DeepSeek的用法類似。你給一個輸入,它會反饋你一個輸出,提供一些專業(yè)的內(nèi)容解答)這種類型的場景下,AI的能力會越來越強。

  第三種場景,在一些特定的練習(xí)場景下,AI是可以承擔(dān)這樣一個角色的。舉個例子,英語對話練習(xí),市面上有很多的產(chǎn)品在做類似的一個事情,這也是比較簡單的對話性的任務(wù),或者是你需要他給你針對一個特定的題目做一下講解,講特定的一道題,簡單的教學(xué)或者是對練,是可以通過AI來做一定的替換的。

  但是除了這三種情況以外,對于其他的比較復(fù)雜的這種任務(wù),以及這種需要老師和學(xué)生進行強互動,強引導(dǎo),甚至帶有一定的管控屬性的任務(wù)和場景,AI在里面更多的只能起到一個簡單的輔助的作用,也很難真的替代真人來完成這些邏輯。

  06

  教育AI的iPhone時刻一定會發(fā)生,但時間、形式不確定

  多知:隨著AI的快速發(fā)展,未來教育行業(yè)的格局會發(fā)生怎樣的大變化?

  羅斌:教育行業(yè)格局如果要發(fā)生大的變化,一定要有一個重要的變量——會不會有真正意義上新形態(tài)的產(chǎn)品出現(xiàn)。教育+AI里會不會有一個iPhone時刻,像當(dāng)年iPhone橫空出世一樣,帶來根本性的產(chǎn)品的變化和升級?

  關(guān)于這件事,我的觀點是,一定會發(fā)生,但是它發(fā)生的時間點和發(fā)生的形式,是不確定的。因為明顯從現(xiàn)在的整個教育市場來看,如果以客戶為中心,現(xiàn)在這個市場上提供的教育產(chǎn)品,從學(xué)習(xí)體驗、學(xué)習(xí)效果、學(xué)習(xí)效率、個性化程度來看,離客戶的理想的期望還是有明顯差異的。

  可以設(shè)想一下,學(xué)員需要的一個理想教育產(chǎn)品是什么樣的?大概率就像我們?nèi)メt(yī)院,從進門那一刻開始,一切環(huán)節(jié)都交給這家醫(yī)院了,診斷、分析、化驗、治療、復(fù)查,是一個端到端的解決方案。

  如果按照理想的狀態(tài)來對比,在教育場景下,我們的客戶需要的是這種方案。但受限于很多因素,今天市場上提供的教育產(chǎn)品,離這個還有很大的距離。其中一個非常大的因素是真正優(yōu)質(zhì)的教育資源/老師的供給是有限的。優(yōu)秀的老師,一方面是包括他的學(xué)科能力、專業(yè)能力,另外一方面上是包括他的教學(xué)能力,對于學(xué)生施加影響的能力。這兩方面能力都比較強的優(yōu)秀老師是一個稀缺資源,另外,成本也不會低。

  所以,有更強大的AI能力后,剛才講的這兩方面都會發(fā)生變化——一方面,成本會更低,因為AI成本未來是會快速下降的。另一方面,供給變得更加充裕了后,可以通過AI和真人老師的協(xié)作和配合,針對學(xué)員提供更加個性化的、更有針對性的、更加端到端的、體驗更加友好的學(xué)習(xí)解決方案。

  這件事情如果真的達成以后,它相對于今天教育領(lǐng)域的模式來講,會有一種根本性的變化。所以我認為,這件事情的發(fā)生,對于未來教育生態(tài)的格局影響是會很大的。

  除了這個之外,其他的,比如各家應(yīng)用AI的能力改變格局等等,從應(yīng)用層面,至少是一個3到5年的周期。也就是說,有的企業(yè)整體應(yīng)用和迭代AI能力的綜合能力會更強,會導(dǎo)致這個企業(yè)顯著地從經(jīng)營效率、規(guī)模、口碑等方面優(yōu)于其他企業(yè)。但這件事情需要的周期是3到5年。

  就像移動互聯(lián)網(wǎng)剛剛出來的時候,也很強大,但離諸如美團、字節(jié)這種成熟品牌的出現(xiàn),中間會有一個回歸周期。所以今天這個節(jié)點,最重要的是要全力擁抱這一浪潮。

  同時,站在教育企業(yè)的角度,核心是要以客戶為中心的,真的想辦法幫客戶創(chuàng)造更好的價值,在過程中怎么能把AI這個能力利用好,不能夠反過來拿著錘子找釘子,不能拿著AI去找東西。

  07

  小型創(chuàng)業(yè)公司,在某些單點上、在某些形態(tài)的產(chǎn)品上,有可能獲得一波特殊的機會

  多知:這種新變革的機會,是更可能出現(xiàn)在教育行業(yè)的創(chuàng)業(yè)公司方面,還是出現(xiàn)在現(xiàn)有的對AI應(yīng)用更好的公司里?

  羅斌:按照我們剛才講的邏輯推演,一個真正有效的符合客戶需求的學(xué)習(xí)解決方案,是一個復(fù)雜的學(xué)習(xí)解決方案。這個復(fù)雜的解決方案的背后,需要強大的組織能力、產(chǎn)品能力、運營能力、技術(shù)能力來作為整體的支撐。

  小型的創(chuàng)業(yè)公司,在某些單點上、在某些形態(tài)的產(chǎn)品上,有可能獲得一波特殊的機會。但是如果回到重交付、端到端、以學(xué)習(xí)結(jié)果為導(dǎo)向的領(lǐng)域里,這里的機會對于創(chuàng)業(yè)公司而言,挑戰(zhàn)還是非常大的。

  因為至少到目前為止,教育行業(yè)本質(zhì)上更接近于服務(wù)業(yè),是人力密集型行業(yè)。這個屬性沒有發(fā)生根本變化之前,這種簡單的通過技術(shù)改變這個行業(yè)的可能性不會發(fā)生。

  但是如果到某一天,AI特別強大,在各種維度上都很強,有沒有可能把它們組合在一起能夠產(chǎn)生完全有別于當(dāng)下的業(yè)態(tài)的可能性呢?不能完全否定這種可能性。這就意味著,教育行業(yè)的iPhone時刻發(fā)生了,那就是另外一種邏輯了。但是這件事情是不會在很短的時間里發(fā)生。比如3-5年,甚至5年以上的周期,有沒有可能?不排除。但在那個時間點,當(dāng)下這些教育頭部企業(yè)也在快速進行迭代,到那個時候他們的能力也不一定亞于新型的創(chuàng)業(yè)公司。

  所以,一個是基于行業(yè)領(lǐng)域的能力,另外一個是基于更加強大的新型生產(chǎn)力,這二者之間到底哪個帶來的影響會更大?中間會是什么樣的結(jié)合和演進方式?

  今天,這一切都是未知的,大家都在快速往前奔跑。

  相關(guān)閱讀:

  DeepSeek攪動教育:現(xiàn)在才是教育AI真正的諾曼底時刻

  對話新東方優(yōu)編程董事長朱宇:DeepSeek如何影響編程教育?