據(jù)猿題庫市場(chǎng)運(yùn)營總監(jiān)帥科介紹,小猿搜題上線一個(gè)月,用戶已經(jīng)達(dá)到了200萬,而且還在以比較快的速度增長。那么,對(duì)于猿題庫來說,為什么進(jìn)入答疑領(lǐng)域?在猿題庫的布局中,小猿搜題扮演者什么樣的角色?

上線一個(gè)月200萬用戶,小猿搜題背后的技術(shù)故事

2015-01-22 09:42:25發(fā)布     來源:多知網(wǎng)    作者:初驪禹  

  多知網(wǎng)1月20日消息,今日,猿題庫組織了一場(chǎng)名為“和工程師聊聊天”的媒體溝通會(huì),小猿搜題項(xiàng)目負(fù)責(zé)人唐巧、猿題庫研究部總監(jiān)鄧澍軍對(duì)小猿搜題的功能、涉及到的技術(shù)做了介紹,并解答相關(guān)問題。

  據(jù)猿題庫市場(chǎng)運(yùn)營總監(jiān)帥科介紹,小猿搜題上線一個(gè)月,用戶已經(jīng)達(dá)到了200萬,而且還在以比較快的速度增長。

  那么,對(duì)于猿題庫來說,為什么進(jìn)入答疑領(lǐng)域?在猿題庫的布局中,小猿搜題扮演者什么樣的角色?

  猿題庫定位學(xué)習(xí)系統(tǒng),小猿搜題定位工具

  猿題庫市場(chǎng)運(yùn)營總監(jiān)帥科表示,猿題庫做小猿搜題主要有兩個(gè)原因。一個(gè)原因是猿題庫的技術(shù)團(tuán)隊(duì)一直在進(jìn)行機(jī)器學(xué)習(xí)的研究,但是研究也需要實(shí)踐,做這樣一個(gè)產(chǎn)品能夠得到鍛煉。另一個(gè)原因是,看到了用戶明確的需求,而且猿題庫團(tuán)隊(duì)能夠?qū)⒋斯δ芸焖俚貙?shí)現(xiàn)。他說,做出小猿搜題,技術(shù)團(tuán)隊(duì)一共只用了三個(gè)月的時(shí)間。

  他同時(shí)表示,小猿搜題在用戶需求和商業(yè)實(shí)現(xiàn)等方面,價(jià)值和權(quán)重都比猿題庫要低很多。猿題庫是一個(gè)智能學(xué)習(xí)系統(tǒng),能夠讓學(xué)生愛上做題、愛上學(xué)習(xí),真正幫助學(xué)生提高能力及分?jǐn)?shù),而小猿搜題是一個(gè)輔助工具,只能解決用戶遇到難題時(shí)查看解析這樣一個(gè)單一、具體的需求。

  小猿搜題的技術(shù)方案:圖像識(shí)別+機(jī)器學(xué)習(xí)+搜索引擎

  據(jù)猿題庫研究部總監(jiān)鄧澍軍介紹,小猿搜題最終確定使用的方案是系統(tǒng)接收用戶上傳的圖片后,經(jīng)過預(yù)處理(即對(duì)圖像的模糊、旋轉(zhuǎn)、顏色反轉(zhuǎn)等問題進(jìn)行處理),切分(對(duì)圖片中的漢字、英文、符合加以區(qū)別),識(shí)別(通過Deep Learning、標(biāo)注數(shù)據(jù)、優(yōu)化算法等對(duì)圖中文字進(jìn)一步識(shí)別),NLP糾錯(cuò)(利用語言模型進(jìn)行糾錯(cuò))等步驟,將題目轉(zhuǎn)化成文字,然后在題庫中進(jìn)行搜索,最終返回題目答案以及解析。另外,這個(gè)過程中還使用了以圖搜圖的技術(shù)加以補(bǔ)充。

  目前,小猿搜題的技術(shù)團(tuán)隊(duì)主要在以下幾個(gè)方面做功能的優(yōu)化,一個(gè)是軟件本身的大小,讓用戶能夠很容易地下載下來,并在版本不高的安卓手機(jī)上能夠順暢運(yùn)行。第二是團(tuán)隊(duì)做了一些處理使得用戶無需注冊(cè)就可以使用拍照答疑功能,同時(shí)也不需要擔(dān)心自己的數(shù)據(jù)保存問題。當(dāng)用戶卸載小猿搜題后,如進(jìn)行再次安裝,還能夠繼續(xù)查看之前的搜題信息。

  之前,小猿搜題在公測(cè)階段上線了人工答疑功能,后來又在一個(gè)月后取消了此項(xiàng)功能。據(jù)唐巧介紹,加入此項(xiàng)功能只是為了收集數(shù)據(jù),即讓用戶在收到錯(cuò)誤結(jié)果的時(shí)候進(jìn)行上報(bào),以此來收集標(biāo)注數(shù)據(jù),以便使系統(tǒng)能夠逐步識(shí)別哪些題目不對(duì)或者哪些題目需要提升。一個(gè)月的時(shí)間內(nèi),這項(xiàng)功能收集了二三十萬數(shù)據(jù),為之后的產(chǎn)品技術(shù)更新迭代提供了數(shù)據(jù)支持。

  當(dāng)多知網(wǎng)問到有關(guān)小猿搜題的盈利模式的問題時(shí),帥科表示,小猿搜題目前會(huì)專注于解決用戶的單一需求上,不會(huì)考慮盈利的事情。目前,小猿搜題還是會(huì)將重點(diǎn)放在題庫的擴(kuò)充和識(shí)別技術(shù)的提高上,暫時(shí)不會(huì)增加新的功能。“拍照搜題的用戶需求非常單一、具體,就是一道題目不會(huì)做,需要立即找到解析和答案,所以我們應(yīng)該把識(shí)別和搜索做到極致。其他的功能,如果不是用戶需要的,而只是我們想讓用戶使用的,毫無價(jià)值。”唐巧說。(多知網(wǎng) 初驪禹)