本次競賽的賽題是解決非母語兒童語音識別問題。

再獲國際AI頂會雙料冠軍,好未來語音識別技術(shù)已應(yīng)用到多個產(chǎn)品

2021-04-12 18:01:07發(fā)布     來源:多知網(wǎng)    作者:Penny  

  多知網(wǎng)4月12日消息,近日,好未來斬獲INTERSPEECH 2021“非母語兒童識別”(The INTERSPEECH 2021 shared task on Automatic Speech Recognition for non-native children’s speech)雙料冠軍。INTERSPEECH作為由國際語音通信協(xié)會ISCA組織的語音研究領(lǐng)域的頂級會議,是全球最大的綜合性語音信號處理領(lǐng)域的科技盛會之一,好未來最終以詞錯率低于第二名而奪冠。

  本次競賽的賽題是解決非母語兒童語音識別問題。由于兒童語音天生的差異性,包含生理差異(如兒童聲道長度較短)、認(rèn)知差異(如語言習(xí)得水平較低,常出現(xiàn)語法邏輯錯誤、發(fā)音前置錯誤、發(fā)音不完整和語種混雜等情況),以及行為差異(如兒童習(xí)慣低聲私語)等,導(dǎo)致通用語音識別模型難以適配,這就讓非母語兒童語音識別系統(tǒng)的構(gòu)建更具挑戰(zhàn)性。另一方面則是非母語兒童語音的數(shù)據(jù)資源較為稀缺,使得常規(guī)聲學(xué)建模方法在該場景下很難奏效。

  針對上述挑戰(zhàn),好未來AI語音團(tuán)隊?wèi){借在實(shí)際教育場景中積累的豐富經(jīng)驗(yàn),充分結(jié)合兒童語音在生理特征及語言認(rèn)知方面的特殊性,嘗試了不同的解決方法。比如在數(shù)據(jù)及特征層面,采用對不同學(xué)齡階段的兒童進(jìn)行歸一化、非語言符號共享、非流利語料生成、分級語言模型構(gòu)建、半監(jiān)督語音活動檢測等方法進(jìn)行針對性優(yōu)化;在聲學(xué)建模層面,采用深度多流CNN與無監(jiān)督pre-training結(jié)合的方案,提升低資源場景下的非母語兒童語音識別性能。

圖片7.png

  圖:競賽系統(tǒng)最終排名,好未來(tal_speech)遙遙領(lǐng)先

  競賽中,好未來最終提交的系統(tǒng)以詞錯率低于第二名而奪得冠軍。該系統(tǒng)更加適配兒童語音識別場景,識別結(jié)果準(zhǔn)確度更高,更重要的是這項(xiàng)技術(shù)的進(jìn)階與應(yīng)用,能夠更大程度地避免通用模型識別兒童語音不準(zhǔn)確對孩子學(xué)習(xí)自信心和積極性造成的負(fù)面影響。

  本次成功摘取“雙冠”的語音識別技術(shù),已經(jīng)廣泛應(yīng)用于好未來旗下各教育產(chǎn)品中,解決教育場景中的真實(shí)問題。

  一方面,好未來用AI語音技術(shù)充分調(diào)動孩子的積極性,為他們提供全新的學(xué)習(xí)體驗(yàn)。如好未來將AI語音識別應(yīng)用于語文、英語的字詞學(xué)習(xí)環(huán)節(jié),對學(xué)生語音實(shí)時轉(zhuǎn)錄,結(jié)合語音評測技術(shù),判斷學(xué)生對知識點(diǎn)的掌握度,智能地推送學(xué)習(xí)內(nèi)容,個性化地安排學(xué)習(xí)進(jìn)度和學(xué)習(xí)路徑。

  另一方面,AI語音技術(shù)也被應(yīng)用到學(xué)而思培優(yōu)小班課的消息盒子與學(xué)而思網(wǎng)校大班課的語音彈幕功能中。該技術(shù)能夠?qū)⒑⒆拥陌l(fā)言實(shí)時展現(xiàn),及時反饋,激勵孩子主動融入課堂,探索學(xué)習(xí)的樂趣,讓課堂不再是老師的“獨(dú)角戲”。課后孩子與老師的互動同樣值得關(guān)注,不擅長打字的孩子,也可以在AI語音技術(shù)的幫助下參與到課后留言討論中,減少師生間的距離感,讓孩子更愿意表達(dá)。

  不僅如此,在培養(yǎng)學(xué)生口語表達(dá)能力方面,AI語音技術(shù)也大有可為。“萌娃小講師”是學(xué)而思培優(yōu)頗具代表性的線下口語表達(dá)活動,旨在培養(yǎng)孩子內(nèi)在自信、邏輯思維等能力。好未來自主研發(fā)的口語表達(dá)能力測評解決方案,支持從流利度、情感、內(nèi)容相關(guān)度、語義邏輯等多重維度,對孩子的口語表達(dá)過程進(jìn)行實(shí)時評測,讓孩子隨時隨地進(jìn)行口述題練習(xí),并且及時獲得反饋報告,激發(fā)孩子的主動學(xué)習(xí)意識。

  AI語音技術(shù)的國際認(rèn)可與創(chuàng)新應(yīng)用,是好未來18年來用前沿科技推動教育進(jìn)步的一個縮影。近年來,好未來獲批承建智慧教育國家新一代人工智能開放創(chuàng)新平臺,并與清華大學(xué)、中科院計算所等6所高校院所建立起緊密的產(chǎn)學(xué)研合作;為解決教育實(shí)際問題而生的幾十項(xiàng)學(xué)術(shù)成果入選ICASSP、NeurIPS、AAAI、WWW、EMNLP、AIED、NCME等國際頂級學(xué)術(shù)會議;好未來AI中臺也在2020年接連斬獲世界計算機(jī)視覺領(lǐng)域頂級會議CVPR-EmotioNet競賽冠軍、世界人機(jī)交互與普適計算領(lǐng)域頂級會議UbiComp競賽冠軍、中國計算語言學(xué)大會CCL2020競賽冠軍等榮譽(yù),這都得益于好未來對科技研發(fā)的大力投入和對底層科研能力的構(gòu)建。

  好未來的AI探索已形成語音技術(shù)、視覺理解、自然語言處理和數(shù)據(jù)挖掘四大方向,探索落地從課前到課后、從內(nèi)容到服務(wù)、覆蓋“教、學(xué)、測、練、評”各教學(xué)環(huán)節(jié)的100余項(xiàng)AI能力、10余項(xiàng)教育場景AI解決方案,支撐包括學(xué)而思培優(yōu)、學(xué)而思網(wǎng)校、學(xué)而思1對1、小猴啟蒙、題拍拍等好未來旗下幾乎所有業(yè)務(wù)部門。