文|馮瑋
在線中文分級閱讀平臺考拉閱讀宣布已完成2000萬美元B輪融資,由GGV紀源資本及XVC共同領投,啟明創(chuàng)投及CMC華人文化產業(yè)基金跟投。
據了解,考拉閱讀日活已接近100萬,用戶平均閱讀時長為30分鐘,考拉CEO趙梓淳透露,藉由用戶數據積累與資本的推動,考拉閱讀一方面會繼續(xù)迭代底層技術,另一方面將與高等院校及權威機構合作,結合用戶數據推動深層研究。
考拉閱讀成立于2016年9月,并于2017年6月推出第一版在線分級閱讀產品,在考拉即將迎來兩周年之際,趙梓淳也分享了屬于考拉的新變化。
(考拉閱讀的創(chuàng)始人、CEO趙梓淳)
產品2.0時期:閱讀數據或成為考拉壁壘
趙梓淳曾在美國讀書,期間受國外分級新聞閱讀產品“Newsela”的啟發(fā),便開始思考能否將國外的分級閱讀理念帶入中國。
“那時藍思分級和 Renaissance 的ATOS 分級測評體系都已經被國外認可且廣泛應用,差不多比我們領先了40年。我想做的,就是結合中國文字的實際情況,推出一套中文分級閱讀體系(ER Framework)?!壁w梓淳回憶。
據了解,ER Framework可測量任意中文文本的閱讀難度值,在200ER-1300ER區(qū)間,數字越大,難度越高,而ER值同時可作為衡量學員閱讀能力水平的標準。
從產品邏輯來看,考拉就是通過ER Framework,從閱讀前期的閱讀能力評定到書目推薦再到后期的閱讀水平考核,幫助學生在閱讀的各個環(huán)節(jié)實現個性化閱讀。
趙梓淳進一步介紹,與AlphaGo訓練CNN策略網絡需要大量高手對弈盤面數據作為訓練輸入相似,考拉閱讀ER Framework采用了大規(guī)模、通過語言學及心理學專家標注的中文分級語料數據。
其將大量精細化處理的非平衡中文分級語料作為輸入,結構化的字詞句段篇特征作為輸出,訓練出深層CNN ResNet以及多層次Bi-LSTM相結合的認知語義理解網絡。
接著通過已完成初步訓練的網絡,處理更大規(guī)模的海量平衡語料(類似于AlphaGo的自我博弈過程),采用弱監(jiān)督學習和遷移學習的方式,有效地利用了更大規(guī)模的半結構化數據。
再經過專家反復評估校正標注質量,將“一精一大”語料進行整合,加強了深度學習網絡訓練的充分性和預測的準確性。
2017年11月,考拉閱讀聯合教育部基礎教育質量監(jiān)測中心和國家語委漢語智能教育中心對一到四線的三十余萬中國學生開展了閱讀能力信息采集,趙梓淳對多知網表示,今年的學生采集數據已達到六十萬,而這些數據也成為考拉2.0產品階段的核心力量之一。
“我們之前的產品算是考拉閱讀的1.0版本,它主要通過專家經驗,結合多學科理論得出推薦模型,是相對靜態(tài)的邏輯?!?/p>
“我們的產品是讓孩子的閱讀能力與文本難度進行適配,這中間很容易有偏差。比如文本本身難度偏高,但孩子在實際做題的時候卻可以答得又快又好,那有可能是作者的語言風格或者這篇文字的背景知識與孩子的積累有結合。因此,大量的學生真實數據就顯得格外重要。”
“而隨著六十萬學生選擇在平臺上進行閱讀以及其每日平均三十分鐘的閱讀習慣,我們拿到了更多涵蓋閱讀到練習的動態(tài)數據?!?/p>
趙梓淳繼續(xù)解讀:“這些數據一方面可以為自身產品做校驗,彌補數據維度缺失,進而做出更精準的推薦模型;另一方面可以與相關機構達成合作,我們的數據積累是研究過程中十分重要的基礎環(huán)節(jié)?!?/p>
但除此之外,趙梓淳也清楚單憑數據的力量還不足以幫助考拉閱讀走得更穩(wěn)妥。

公立校是閱讀產品的最好入口?
據了解,考拉閱讀目前主要與B端合作,已進入幾千所公立學校,且均為免費。
在現階段,暫不考慮變現的考拉閱讀選擇B端也有其深層邏輯,在某次采訪中,趙梓淳曾這樣解讀:
“現在To C的少兒閱讀產品挺多,大多是通過打造IP,購買版權內容,吸引大量用戶,趕快收費。我覺得這樣的商業(yè)模式沒有什么問題,但我們選擇的路不太一樣,可以說我們的野心更大一些。”
首先,考拉閱讀想確立中文分級閱讀標準,做一套中國版的藍思分級系統。而這套標準想要得到社會認可,就需要公立學校來做信任背書。所以,考拉閱讀選擇從To B切入來解決公信力的問題。
其次,教育產品的用戶和消費產品的用戶不一樣,學生用戶隨著年齡的增長,天然就要流失,所以純To C的商業(yè)模式注定企業(yè)必須快速變現,否則獲取的大量用戶是沒有意義的。
基于此,趙梓淳對多知網也做了進一步的解釋:“面對必然會流失的流量和必然會長高的成本,B端就是流量抓取的關鍵?!?/p>
另據了解,考拉閱讀基于公立校閱讀數據,將于近期推出《中國學生大數據閱讀報告》(暫定名)。
白皮書中指出,孩子的閱讀能力與所在城市的經濟水平正相關,一二線城市各年級能力ER值均高于四五線城市,一二線城市三年級學生平均水平已經劍姬無線城市四年級平均水平。
但是,各線城市中成績靠前的學校間并沒有明顯差異,五線城市的縣級小學中,也有能力不輸于一線城市排名靠前的學校,如山西省忻州市五臺縣實驗小學。
另外在男生和女生的對比中來看,同年級的女生閱讀能力高于男生,且在六年級差異最為明顯,相當于領先三個月的學習時間;但在其他年級,男生超過女生的情況集中在一二線城市的低年級。
趙梓淳表示,公立校數據的整合將有助于其接下來為學校提供的個性化推薦,他也透露,未來不排除將把目前用戶群體轉向C端,提供自適應閱讀系統,同時也可能嘗試類似kindle的閱讀硬件產品。
當大語文漸入佳境,“大閱讀”繁榮還有多遠?
趙梓淳透露,近半年考拉日活用戶激增,短期內從3000增長至100萬,而這背后主要有四方面原因。
其一、政策向導。
前有書香中國、書香校園的推動,后有新高考改革對閱讀能力的關注,以應試為向導,以校園活動為支撐,都讓公立校對閱讀產品的擁抱度逐漸增長。
隨著一批機構對大語文產品的擁躉,自然也會為語文品類中的閱讀產品帶來積極的推動作用。
其二、在線教育熱。
“閱讀離應試可能很遠。但現在家長都很焦慮,他們自己看書看不進去,就用“得到”,20分鐘聽完。這種焦慮會傳給孩子,他們的孩子也要看書閱讀,你說是不是剛需?”趙梓淳曾這樣解讀。
而隨著在線教育模式的普及和推廣,令在線閱讀類產品的使用度開始提升。
其三、家長理念變化。
隨著80、90后家長成為K12階段家長主流人群,這個階段家長對知識的付費意愿也更加靈活,區(qū)別于曾經的學好數理化,現在的家長會關注孩子的綜合能力。
家庭層面對孩子的閱讀能力培養(yǎng)也開始從胎教貫穿至整個成長周期。
其四、產品邏輯。
“語文學習是一個很感性的東西,之前主要是老師或者長輩、同學間的內容分享和自我感知,那么怎么把語文能力、閱讀能力進行量化評估,此外如何基于學生情況去進行個性化推薦,幫助孩子在閱讀上可以循序漸進一直都是一個問題?!?/p>
趙梓淳表示,基于這些需求,考拉閱讀幫助那些希望閱讀能力提升但是不知道如何選內容以及真實了解閱讀狀態(tài)的家庭,提供理性產品。
除此之外,趙梓淳認為之所以資本市場開始關注并推動閱讀類產品的發(fā)展,或許也是其認為少兒閱讀領域有需要變革的地方,它帶來的商業(yè)價值將會可期。
前幾天趙梓淳收到條語音,一個二年級小男孩兒奶聲奶氣慢悠悠地說:“我特別喜歡考拉博士,考拉博士讓我比其他小朋友厲害好多呀!”
他說自己聽了好幾遍,那是打心眼里讓他覺得有成就感的事兒。
發(fā)表評論