未來(lái)方向:提供更定制化的AI課程,要在技術(shù)、數(shù)據(jù)上建立壁壘。

葡萄智學(xué)韓異凡談“闖關(guān)”:AI產(chǎn)品模型更適合兒童英語(yǔ)賽道

2019-03-15 08:26:14發(fā)布     來(lái)源:多知網(wǎng)    作者:黎珊  

  多知網(wǎng)3月15日消息,在【Open Talk】第十九期“AI英語(yǔ)老師‘躥紅’:耍把式還是有本事?”活動(dòng)上,葡萄智學(xué)聯(lián)合創(chuàng)始人韓異凡分享了葡萄英語(yǔ)從選型、驗(yàn)證技術(shù)可行性到完善教學(xué)流程、不斷提升技術(shù)能力等打磨階段經(jīng)歷的事情。現(xiàn)如今,市場(chǎng)上類似的產(chǎn)品正在增多,韓異凡提到,葡萄英語(yǔ)接下來(lái)要跑得更快,在技術(shù)和數(shù)據(jù)層面建立壁壘。

  

  (葡萄智學(xué)聯(lián)合創(chuàng)始人韓異凡)

  以下為韓異凡演講全文(經(jīng)多知網(wǎng)編輯):

  葡萄智學(xué)成立于2018年3月份,初創(chuàng)團(tuán)隊(duì)大部分來(lái)自于搜狗搜索,幾位聯(lián)合創(chuàng)始人基本都是從一畢業(yè)就進(jìn)入了搜狗,做了十幾年的搜索,在人工智能領(lǐng)域有著比較深入的認(rèn)知和技術(shù)上的積累。

  現(xiàn)今的教育行業(yè),有很多的痛點(diǎn)存在,比如教育資源的稀缺性,我們認(rèn)為人工智能能夠在很大程度上去解決這些問(wèn)題。從另外一個(gè)維度上說(shuō),它也可以降低成本,讓更多的人能夠享受優(yōu)質(zhì)的教育資源。

  葡萄智學(xué)成立后,選取了英語(yǔ)學(xué)科作為一個(gè)切入點(diǎn)。經(jīng)過(guò)半年時(shí)間左右的研發(fā),第一款產(chǎn)品葡萄英語(yǔ)就上線了,我們希望用科技提升學(xué)習(xí)效率和教育資源的平衡。

  當(dāng)前人工智能三大核心技術(shù)組成:圖像識(shí)別、語(yǔ)音技術(shù)、語(yǔ)義理解

  在講述葡萄英語(yǔ)這款產(chǎn)品整個(gè)打磨歷程之前,我大概講一下人工智能技術(shù)有哪些。如今人工智能的核心應(yīng)用技術(shù)有三個(gè):第一是圖像識(shí)別,第二是語(yǔ)音技術(shù),第三個(gè)是語(yǔ)意理解。

  首先是圖像識(shí)別,圖像識(shí)別有幾個(gè)細(xì)分技術(shù)領(lǐng)域。比如文字識(shí)別,應(yīng)用到教育領(lǐng)域,大家看到的拍圖搜題,自動(dòng)閱卷,都是用了文字識(shí)別的技術(shù)。

  識(shí)圖搜索也是應(yīng)用的比較早期的一款技術(shù)。這種技術(shù)被應(yīng)用的場(chǎng)景是,你看到誰(shuí)穿了一件衣服可以拍張照片,通過(guò)識(shí)圖找到這件衣服的購(gòu)買鏈接,或者去找這件衣服的相似款。

  人臉識(shí)別技術(shù)比較有價(jià)值的應(yīng)用也有很多,應(yīng)用到教育領(lǐng)域,可以分析孩子學(xué)習(xí)時(shí)候的注意力、興趣度、關(guān)注度等等,進(jìn)而調(diào)整后續(xù)的教學(xué)方法和內(nèi)容。

  還有一些是圖像識(shí)別技術(shù)和其他人工智能的技術(shù)結(jié)合在一起做的應(yīng)用。比如像圖文翻譯、照片生成。

  第二個(gè)人工智能的核心技術(shù):語(yǔ)音技術(shù)。語(yǔ)音技術(shù)從大的應(yīng)用方向上講,語(yǔ)音識(shí)別、語(yǔ)音評(píng)測(cè)和語(yǔ)音合成這三個(gè)大的方向。其它比如有效語(yǔ)音判斷、語(yǔ)音增強(qiáng)和聲紋識(shí)別其實(shí)是為了輔助比如語(yǔ)音識(shí)別的正確性、準(zhǔn)確率去做的額外工作。

  語(yǔ)音識(shí)別是把我們說(shuō)的話能夠轉(zhuǎn)換成一種文字。我們做實(shí)際應(yīng)用的時(shí)候,在葡萄英語(yǔ)場(chǎng)景里面,我們需要識(shí)別孩子說(shuō)的英文具體的含義是什么。在這個(gè)過(guò)程里,有效語(yǔ)音判斷、語(yǔ)音增強(qiáng)和聲紋識(shí)別這些分支的技術(shù)都會(huì)起到一些作用,比如說(shuō)我們會(huì)發(fā)現(xiàn)孩子在學(xué)習(xí)英語(yǔ)的過(guò)程中家長(zhǎng)會(huì)陪在旁邊,背景音會(huì)有家長(zhǎng)聊天的聲音,這個(gè)時(shí)候就需要通過(guò)有效語(yǔ)言判斷,通過(guò)聲紋識(shí)別的技術(shù)把家長(zhǎng)的聲音過(guò)濾掉,拿到孩子的聲音。

  語(yǔ)音評(píng)測(cè)是指發(fā)音質(zhì)量的評(píng)測(cè),對(duì)英語(yǔ)而言又有很多細(xì)分的項(xiàng)目。發(fā)音的準(zhǔn)確度,句子的發(fā)音流暢度、完整度等等。

  語(yǔ)音合成其實(shí)是語(yǔ)音識(shí)別的一個(gè)反向應(yīng)用,它把文字轉(zhuǎn)變成語(yǔ)音輸出出來(lái)。語(yǔ)言合成再往上就是一種帶著情感遷移的語(yǔ)音合成,它可以合成出符合某個(gè)人的音色、音質(zhì)特征的語(yǔ)音出來(lái)。

  第三個(gè)人工智能的核心技術(shù)是語(yǔ)意理解,語(yǔ)意理解是人工智能技術(shù)里面最難的一項(xiàng)技術(shù)。我通常會(huì)打比方說(shuō)人工智能能做到一個(gè)什么樣的水平和一個(gè)真人做這件事情是否容易做一些類比。就像語(yǔ)意理解這件事情,我們可以設(shè)想兩個(gè)真人在做溝通,經(jīng)常會(huì)出現(xiàn)A說(shuō)了一句話,B理解的時(shí)候很有可能就理解出來(lái)完全不同的一個(gè)意思。語(yǔ)意理解是非常困難的事情。

  技術(shù)和內(nèi)容為打磨重點(diǎn),葡萄智學(xué)相關(guān)團(tuán)隊(duì)人員占比80%

  我覺(jué)得有一句話說(shuō)的特別對(duì),“因?yàn)橄嘈潘钥匆?jiàn)”,葡萄相信人工智能是提升教育質(zhì)量與公平的最有效解決方案。我們從教育最核心的三個(gè)元素入手,去構(gòu)建葡萄英語(yǔ)這款產(chǎn)品。內(nèi)容層面上來(lái)說(shuō),我們通過(guò)自己去構(gòu)建內(nèi)容的方式來(lái)最終達(dá)到因材施教。師資層面我們構(gòu)建了一個(gè)智能老師。技術(shù)層面,最終通過(guò)技術(shù)的方式能夠促進(jìn)教育的公平性。

  

  團(tuán)隊(duì)對(duì)人工智能領(lǐng)域技術(shù)的深入理解和深厚積累,是打造葡萄英語(yǔ)的第一階段。

  有了這樣的積累之后,要去做一款兒童英語(yǔ)學(xué)習(xí)的產(chǎn)品,我們面臨的第一個(gè)問(wèn)題是選型。選產(chǎn)品形態(tài),當(dāng)時(shí)有兩類,是1V1的真人教學(xué),還是偏游戲的人機(jī)交互方式?

  成人可以自學(xué),但是孩子不可能一直坐著,按照機(jī)械的操作完成學(xué)習(xí)??紤]到教育這件事情的嚴(yán)肅和嚴(yán)謹(jǐn)性,以及兒童學(xué)習(xí)的特點(diǎn),我們選擇了1V1的教學(xué)方式,也是尊重教育的嚴(yán)肅性。

  選擇完這樣一種產(chǎn)品形態(tài)之后,接下來(lái)面臨的是老師是用真人老師還是用虛擬形象?其實(shí)最早是想用虛擬形象,當(dāng)時(shí)有很多的想法,我們可以簽很多的IP,孩子可以選喜歡的IP形象,比如可以讓唐老鴨教他學(xué)英語(yǔ),這對(duì)AI而言沒(méi)有任何的成本。

  但是當(dāng)我們看了大量教學(xué)視頻之后,會(huì)發(fā)現(xiàn)英語(yǔ)教學(xué)里老師的語(yǔ)音、語(yǔ)調(diào)、表情、動(dòng)作,對(duì)于整個(gè)教學(xué)質(zhì)量是至關(guān)重要的。它不是說(shuō)你去構(gòu)建一個(gè)虛擬動(dòng)畫形象的建模,給他生產(chǎn)幾套動(dòng)作,就能夠?qū)崿F(xiàn)的。所以我們當(dāng)時(shí)就選擇了真人老師的方向,當(dāng)時(shí)選擇的時(shí)候,市面上還沒(méi)有這樣的方式。

  確定了產(chǎn)品的形態(tài)之后,接下來(lái)我們驗(yàn)證我們所設(shè)想的技術(shù)可行性。首先驗(yàn)證的是,比如在語(yǔ)音識(shí)別這件事情上,我們能不能做到和真人一樣的及時(shí)反饋,以及整節(jié)課下來(lái)能不能真的逼近直播的互動(dòng)效果。

  在驗(yàn)證了技術(shù)是可以做到這一點(diǎn)之后,接下來(lái)我們做的是完善教學(xué)流程。

  

  葡萄英語(yǔ)其實(shí)是非常重的一款產(chǎn)品,葡萄英語(yǔ)在主課之外會(huì)有預(yù)習(xí)環(huán)節(jié),還有個(gè)性化的作業(yè)環(huán)節(jié),我們?yōu)橹髡n配備了輔修課,還會(huì)為孩子生成個(gè)性化輔導(dǎo)課。個(gè)性化輔導(dǎo)課結(jié)合整個(gè)單元的課程報(bào)告,依托AI大數(shù)據(jù)分析,設(shè)計(jì)出針對(duì)孩子薄弱部分的專屬課程。

  此外,我們還加了入學(xué)測(cè)試以及階段測(cè)試,給孩子輸出能力模型報(bào)告。在做教育這件事情上,我們還是很嚴(yán)謹(jǐn)?shù)模诮滩纳衔覀円肓伺=虼髮W(xué)出版社《Let's Go》的版權(quán),我們?cè)谥忻烙⑷囟冀⒘私萄兄行?。在英?guó),我們聘請(qǐng)了英國(guó)劍橋的博士作為教研中心負(fù)責(zé)人,每堂課的課件都經(jīng)過(guò)審核。

  現(xiàn)如今,技術(shù)和教研團(tuán)隊(duì)的規(guī)模占葡萄智學(xué)的80%,葡萄在技術(shù)和內(nèi)容層面的投入占比非常大。

  前期的工作完成之后,接下來(lái)我們就重點(diǎn)提升技術(shù)實(shí)力,我們公司核心的基因還是技術(shù)。2月28號(hào)我們?cè)诰€上換上了我們自己的引擎,這也是從去年我們就一直在研發(fā)的自有引擎,我們?cè)u(píng)估我們的自有語(yǔ)音引擎效果是兩倍于現(xiàn)在市面上所有的第三方語(yǔ)音引擎效果。

  

  我們現(xiàn)在還在研發(fā)對(duì)話系統(tǒng),我們希望未來(lái)孩子會(huì)有一個(gè)玩伴陪同他去學(xué)習(xí),我們有一個(gè)IP形象叫淘淘,它會(huì)和孩子做口語(yǔ)聽(tīng)力的對(duì)話訓(xùn)練,通過(guò)IP形象動(dòng)畫互動(dòng)的方式,讓孩子既不枯燥,也可以在玩中練了口語(yǔ)和對(duì)話。

  葡萄英語(yǔ)這款產(chǎn)品會(huì)把人工智能的知識(shí)圖譜、語(yǔ)音識(shí)別和評(píng)測(cè),對(duì)話系統(tǒng)、自適應(yīng)學(xué)習(xí),個(gè)人的學(xué)習(xí)報(bào)告和能力模型的構(gòu)建等一系列的技術(shù)應(yīng)用在其中,并且會(huì)串聯(lián)在整個(gè)產(chǎn)品的每一個(gè)環(huán)節(jié)。

  學(xué)生上主課里面做的每一個(gè)練習(xí),每一個(gè)知識(shí)點(diǎn)的掌握程度,課后作業(yè)做的情況,以及對(duì)話系統(tǒng)的產(chǎn)品里面做的對(duì)話練習(xí),這些數(shù)據(jù)我們都會(huì)記錄下來(lái),去分析這個(gè)孩子的能力模型是什么,繼而去調(diào)整接下來(lái)這個(gè)孩子他的教學(xué)應(yīng)該是怎樣的。

  未來(lái)方向:提供更定制化的AI課程,要在技術(shù)、數(shù)據(jù)上建立壁壘

  AI老師在兒童英語(yǔ)學(xué)習(xí)上有哪些痛點(diǎn)?真人老師效果不穩(wěn)定,師資有限,好老師稀缺,這都是現(xiàn)實(shí)真實(shí)存在的問(wèn)題,包括好老師的稀缺性推高了成本和價(jià)格,現(xiàn)在很多線上課是需要預(yù)約的,上課不靈活,以及難以針對(duì)每個(gè)學(xué)生去做因材施教,這都是現(xiàn)在教育存在的一些痛點(diǎn)。

  而AI老師完全可以解決這些問(wèn)題。AI老師效果穩(wěn)定,好老師無(wú)限復(fù)制,可以24小時(shí)在線,孩子可以無(wú)需預(yù)約隨時(shí)上課,更是可以提供千人千面的個(gè)性化教學(xué)。

  葡萄英語(yǔ)已將AI技術(shù)貫穿到了整個(gè)英語(yǔ)教學(xué)的過(guò)程,通過(guò)AI定制1對(duì)1教學(xué),讓每個(gè)孩子都能“因材施教”。目前我們產(chǎn)品已經(jīng)上了個(gè)性化測(cè)評(píng)課,我們通過(guò)一套孩子的練習(xí)反饋數(shù)據(jù)科學(xué)測(cè)量孩子的真實(shí)水平,并去匹配推薦最適合孩子的課程。葡萄英語(yǔ)還有一個(gè)單元大復(fù)習(xí)課,會(huì)根據(jù)本單元孩子的學(xué)習(xí)變化、知識(shí)能力掌握情況,量身定制個(gè)性化輔導(dǎo)課,讓孩子在游戲互動(dòng)場(chǎng)景下進(jìn)行查缺補(bǔ)漏,邊玩邊學(xué),吃透每個(gè)知識(shí)點(diǎn)。

  葡萄英語(yǔ)AI定制課的虛擬老師也針對(duì)各種場(chǎng)景做了各種處理,甚至提前預(yù)埋了很多突發(fā)情況的解決方案。比如,當(dāng)孩子發(fā)音不標(biāo)準(zhǔn)的時(shí)候,當(dāng)孩子用中文回答的時(shí)候,當(dāng)孩子不想答,AI老師都會(huì)針對(duì)性的給出反應(yīng),例如鼓勵(lì)孩子再來(lái)一次,再講解一次問(wèn)題讓孩子做選擇等。葡萄英語(yǔ)的課程有很強(qiáng)的互動(dòng)性,涵蓋聽(tīng)說(shuō)讀寫各種訓(xùn)練,課程整體時(shí)?;究刂圃?5分鐘左右。

  我一直認(rèn)為未來(lái)的教育一定是因材施教的,每個(gè)孩子都不一樣,怎樣找到一種適合這個(gè)孩子的內(nèi)容以及適合這個(gè)孩子的教學(xué)方法,才能達(dá)到更高效的學(xué)習(xí),這是AI老師未來(lái)可以做到的一點(diǎn)。葡萄英語(yǔ)是要“讓每一個(gè)孩子能夠公平且高效的學(xué)習(xí)”。

  去年12月26號(hào)融資消息公布后,接下來(lái)就有很多類似的產(chǎn)品出來(lái),在這樣的競(jìng)爭(zhēng)環(huán)境下,我們只能做得更快。因?yàn)槲覀冎垃F(xiàn)在這款產(chǎn)品還有很大的潛力空間,我們自己知道我們未來(lái)要做成一個(gè)什么樣子,我們必須跑得更快,在技術(shù)和數(shù)據(jù)以及用戶心智層面建立壁壘。

  【問(wèn)答環(huán)節(jié)】

  問(wèn):孩子比較喜歡現(xiàn)實(shí)生活的某一位老師,我想模擬一下現(xiàn)實(shí)中老師他的形態(tài)以及說(shuō)話的方式,如果要實(shí)現(xiàn),這個(gè)難度有多大?

  韓異凡:技術(shù)難度不大,難度在數(shù)據(jù)層面。要擁有豐富的老師的大量視頻才可以把這個(gè)建模給建出來(lái)。

  問(wèn):需要多少?

  韓異凡:幾百小時(shí)這樣的視頻量,而且可能對(duì)于本身視頻的質(zhì)量還要有很高的要求。現(xiàn)在在技術(shù)層面比較可行的一種方案是老師在專業(yè)的場(chǎng)景里面,就跟拍武打片類似的采集點(diǎn),這樣效果會(huì)更好。如果僅僅是視頻的話,其實(shí)現(xiàn)在的技術(shù)做起來(lái)還是會(huì)有一定的困難。