豆包老師具備了一定的多模態(tài)講題能力。

字節(jié)的教育新答卷:豆包愛(ài)學(xué)做了“豆包老師”

2025-09-15 10:06:26發(fā)布     來(lái)源:多知    作者:王上  

  近日,豆包愛(ài)學(xué)APP官方宣布,正式上線“豆包老師”,免費(fèi)、全學(xué)科、沉浸式互動(dòng)。

  多知體驗(yàn)發(fā)現(xiàn),豆包愛(ài)學(xué)“豆包老師”的特色在于:動(dòng)態(tài)板書(shū)演示、老師語(yǔ)音輸出,過(guò)程中會(huì)和學(xué)生進(jìn)行語(yǔ)音互動(dòng),以及,用戶可以點(diǎn)擊查看老師講解的全部“字幕”。

  也就是說(shuō),相對(duì)于通用大模型,豆包愛(ài)學(xué)基于豆包多模態(tài)大模型研發(fā)的“豆包老師”更像模擬學(xué)生線下教室的情景,只不過(guò)在這個(gè)“教室”里,老師是以“聲音”和“圖畫(huà)板書(shū)”、“知識(shí)點(diǎn)提煉”形式出現(xiàn)的,未設(shè)置數(shù)字人形象。

  和教育科技公司推出的拍照講題類產(chǎn)品相比,豆包愛(ài)學(xué)或許想做一個(gè)更加“通用”的、針對(duì)小學(xué)和中學(xué)生的大模型。從介紹來(lái)看,除了講解各個(gè)科目的題目,也會(huì)解答生活百科等。更像一個(gè)針對(duì)小學(xué)、中學(xué)生“學(xué)習(xí)”和“生活”融合場(chǎng)景的豆包老師。

  字節(jié)跳動(dòng)在教育領(lǐng)域的核心產(chǎn)品中,海外產(chǎn)品拍照答疑產(chǎn)品Gauth(相關(guān)閱讀:《字節(jié)Gauth再進(jìn)化:從拍作業(yè),到拍生活》),坐擁3億全球用戶、近5000萬(wàn)月活用戶,國(guó)內(nèi)則是豆包愛(ài)學(xué)。

  其中,AI教育團(tuán)隊(duì),是曾經(jīng)大力教育團(tuán)隊(duì)保留下來(lái)的“火種”。豆包愛(ài)學(xué)原名河馬愛(ài)學(xué),2024年更名為豆包愛(ài)學(xué)。該APP底層是字節(jié)跳動(dòng)豆包大模型,上線之初即提供作業(yè)批改、拍題答疑、口算批改、作文批改等功能。今年6月份,新增深度講解功能。當(dāng)下,上線了豆包老師、識(shí)萬(wàn)物等功能,提供更多學(xué)習(xí)、生活場(chǎng)景的解決方案。

  從“豆包老師可以看出,繼大力教育之后,字節(jié)在教育AI領(lǐng)域投入的決心未滅。

  從呈現(xiàn)形式看,豆包老師目前已經(jīng)應(yīng)用了一定的多模態(tài)講題能力。

IMG_7828.jpeg

  進(jìn)入該功能后,有兩種問(wèn)問(wèn)題的方式:可以拍題目,也可以輸入問(wèn)題。

  多知邀請(qǐng)小朋友一起體驗(yàn),注冊(cè)時(shí)設(shè)定了小學(xué)三年級(jí),小朋友提出了一個(gè)問(wèn)題:“為什么自行車車輪會(huì)有輻條?”

  如果問(wèn)通用大模型,通常就是給出文字解答。

  而豆包愛(ài)學(xué)的“豆包老師”是先把問(wèn)題進(jìn)行了拆解,一是為什么不用實(shí)心輪?二是輻條有什么作用。在講解過(guò)程中會(huì)一邊畫(huà)圖,一邊語(yǔ)言講解,還會(huì)問(wèn)小朋友“你理解了嗎”,然后再進(jìn)行下一步。

  這種圖示和互動(dòng)接近線下課堂的體驗(yàn),“動(dòng)態(tài)板書(shū)演示”能夠?qū)?fù)雜知識(shí)轉(zhuǎn)化為清晰的圖像與動(dòng)態(tài)畫(huà)面。

 

  同樣,問(wèn)“小鳥(niǎo)站在高壓電線上為什么不會(huì)被電”、“磁懸浮列車如何轉(zhuǎn)彎”、“大禹治水的方法”等小學(xué)生會(huì)好奇的問(wèn)題,豆包老師同樣會(huì)呈現(xiàn)可視化的板書(shū),給講解增添了一些趣味性以及降低理解門檻。

IMG_7831.jpeg

  和通用大模型不同的是,豆包老師并不在講解面上展示全部的文字內(nèi)容,優(yōu)先聲音輸出、可視化板書(shū)、關(guān)鍵知識(shí)點(diǎn)提煉。點(diǎn)擊老師的語(yǔ)音條,則可以查看完整的講解“字幕”。這種圖示和互動(dòng)模擬了線下課堂的體驗(yàn)。

  這種圖文并茂的呈現(xiàn)方式尤其適用于理科教學(xué),它能將復(fù)雜的公式、定理等轉(zhuǎn)化為清晰的圖像,輔助學(xué)生理解。

  根據(jù)官方介紹,這背后是豆包愛(ài)學(xué)在多模態(tài)理解、教育語(yǔ)義建模與實(shí)時(shí)渲染技術(shù)方面的系統(tǒng)能力,將抽象知識(shí)、過(guò)程邏輯可視化。

  多知還體驗(yàn)了一道雞兔同籠經(jīng)典題目,豆包老師給出的“抬腿法”解題方式,符合小學(xué)三年級(jí)的認(rèn)知水平。整個(gè)過(guò)程是一步一步地進(jìn)行解答,并且在關(guān)鍵步驟,“豆包老師”會(huì)主動(dòng)問(wèn)“是否聽(tīng)懂了”,用戶需要按住語(yǔ)音按鈕回答,然后才會(huì)繼續(xù)解答。

 

  而我們告訴豆包老師,請(qǐng)你用初一所學(xué)知識(shí)去解答這道題。那么,豆包老師會(huì)用一元一次方程的知識(shí)點(diǎn)去解答這道理。

  可以看到,針對(duì)不同年齡段,豆包老師會(huì)給出不同的解答思路。

  目前來(lái)看,豆包愛(ài)學(xué)更多以小學(xué)、中學(xué)學(xué)齡段為主。未來(lái),如何呈現(xiàn)更復(fù)雜的知識(shí)點(diǎn),多模態(tài)答疑能力如何迭代,有待觀察。

  在教育領(lǐng)域,字節(jié)的產(chǎn)品矩陣已形成清晰的端側(cè)布局(字節(jié)不再執(zhí)著于教育業(yè)務(wù),卻贏得了教育用戶):C端擁有 Gauth、豆包愛(ài)學(xué)等面向個(gè)體用戶的產(chǎn)品,可直接服務(wù)學(xué)習(xí)者需求;B端則由火山引擎提供核心支撐,為教育行業(yè)的各類軟件與硬件產(chǎn)品提供底層技術(shù)底座,覆蓋教學(xué)管理系統(tǒng)、智能終端設(shè)備等多類應(yīng)用場(chǎng)景。

  當(dāng)下,無(wú)論是教育科技公司、科技大廠、創(chuàng)業(yè)公司,在探索孩子、學(xué)生如何應(yīng)用大模型方面,在從不同角度、不同載體上探索各個(gè)形態(tài)的產(chǎn)品。

  例如,針對(duì)學(xué)齡前的用戶,AI陪伴玩具、AI便攜硬件是主流。

  針對(duì)小學(xué)、中學(xué)生,各個(gè)形態(tài)的“AI老師”/“AI家教”層出不窮。教育科技領(lǐng)域如小思AI、小猿AI、新東方AI 1對(duì)1 、高途毛豆愛(ài)學(xué)、洋蔥學(xué)園、伴魚(yú)AI私教等。在通用大模型中,夸克旗下夸克學(xué)習(xí)此前在今年6月推出夸克老師功能,并在今年9月已經(jīng)推出夸克學(xué)習(xí)APP。在海外,有自動(dòng)生成的視頻講解工具VideoTutor,目標(biāo)也是能像真人老師一樣講課。同時(shí),硬件學(xué)習(xí)產(chǎn)品也在融入AI老師的功能,如學(xué)而思學(xué)習(xí)機(jī)、小猿學(xué)習(xí)機(jī)、有道詞典筆等。

  無(wú)論如何,AI正在使24小時(shí)的AI家教觸手可得了。

  END

  作者:王上