小米將重點(diǎn)投入AI。

消息稱雷軍千萬年薪招攬95后AI天才少女,大模型人才轉(zhuǎn)向場景應(yīng)用?

2024-12-30 13:24:29發(fā)布     來源:多知    作者:Penny  

  多知12月30消息,今日,“雷軍千萬年薪招攬95后AI天才少女”沖上熱搜。據(jù)證券時報報道,小米創(chuàng)始人雷軍親自出手,以千萬年薪招攬DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉,領(lǐng)導(dǎo)小米AI大模型團(tuán)隊(duì),羅福莉?qū)⒕吐氂谛∶譇I實(shí)驗(yàn)室。對此,小米暫未回應(yīng)。

  公開資料顯示,羅福莉出生在四川小城一個普通家庭,本科畢業(yè)于北師大計(jì)算機(jī)專業(yè),后保研至北京大學(xué)計(jì)算語言學(xué)研究所。碩士畢業(yè)后,她因是“ACL 8篇論文作者”火爆網(wǎng)絡(luò),隨后加入了阿里達(dá)摩院機(jī)器智能實(shí)驗(yàn)室。

  2022年,羅福莉離開阿里達(dá)摩院,加入幻方量化(量化對沖基金公司)從事深度學(xué)習(xí)相關(guān)策略建模和算法研究。此后,羅福莉加入北京深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(旗下有DeepSeek大模型),擔(dān)任深度學(xué)習(xí)研究員,并參與了MoE大模型DeepSeek-V2的研發(fā)。

  今年5月,在DeepSeek-V2發(fā)布以后,羅福莉在知乎撰文,發(fā)表了對于DeepSeek-V2的看法。她表示,“單論DeepSeek-V2模型的中文水平,是真實(shí)處在國內(nèi)外閉源模型的第一梯隊(duì)”,“外加1元/百萬輸入Tokens的價格,只有GPT4價格的1/100,性價比之王”。

  12月26日,Deepseek通過官方公眾號稱,全新系列模型DeepSeek-v3首個版本上線并同步開源,該模型的多項(xiàng)評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

  比如,在百科知識、長文本、代碼、數(shù)學(xué)、中文能力上的表現(xiàn),超越其他模型,尤其是在數(shù)學(xué)上,在美國數(shù)學(xué)競賽(AIME 2024, MATH)和全國高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上,DeepSeek-V3 大幅超過了所有開源閉源模型。

WechatIMG3.jpg

  同時,通過算法和工程上的創(chuàng)新,DeepSeek-V3 的生成吐字速度從20 TPS大幅提高至 60 TPS,相比 V2.5 模型實(shí)現(xiàn)了3倍的提升。

  該模型的訓(xùn)練成本僅600萬美元,成本降低10倍,資源運(yùn)用效率極高。

  相比一個大模型公司,小米則是有很多應(yīng)用終端,手機(jī)、汽車等。根據(jù)2024年Q3財報顯示,小米集團(tuán)的AIoT平臺已連接的IoT設(shè)備數(shù)超8.61億,同比增長23.2%。

  雷軍親自挖人,意味著小米將重點(diǎn)投入AI。