消息稱雷軍千萬年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場景應(yīng)用？

2024-12-30 13:24:29發(fā)布來源：多知作者：Penny

　　多知12月30消息，今日，“雷軍千萬年薪招攬95后AI天才少女”沖上熱搜。據(jù)證券時報報道，小米創(chuàng)始人雷軍親自出手，以千萬年薪招攬DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉，領(lǐng)導小米AI大模型團隊，羅福莉?qū)⒕吐氂谛∶譇I實驗室。對此，小米暫未回應(yīng)。

　　公開資料顯示，羅福莉出生在四川小城一個普通家庭，本科畢業(yè)于北師大計算機專業(yè)，后保研至北京大學計算語言學研究所。碩士畢業(yè)后，她因是“ACL 8篇論文作者”火爆網(wǎng)絡(luò)，隨后加入了阿里達摩院機器智能實驗室。

　　2022年，羅福莉離開阿里達摩院，加入幻方量化(量化對沖基金公司)從事深度學習相關(guān)策略建模和算法研究。此后，羅福莉加入北京深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(旗下有DeepSeek大模型)，擔任深度學習研究員，并參與了MoE大模型DeepSeek-V2的研發(fā)。

　　今年5月，在DeepSeek-V2發(fā)布以后，羅福莉在知乎撰文，發(fā)表了對于DeepSeek-V2的看法。她表示，“單論DeepSeek-V2模型的中文水平，是真實處在國內(nèi)外閉源模型的第一梯隊”，“外加1元/百萬輸入Tokens的價格，只有GPT4價格的1/100，性價比之王”。

　　12月26日，Deepseek通過官方公眾號稱，全新系列模型DeepSeek-v3首個版本上線并同步開源，該模型的多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型，并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

　　比如，在百科知識、長文本、代碼、數(shù)學、中文能力上的表現(xiàn)，超越其他模型，尤其是在數(shù)學上，在美國數(shù)學競賽(AIME 2024, MATH)和全國高中數(shù)學聯(lián)賽(CNMO 2024)上，DeepSeek-V3 大幅超過了所有開源閉源模型。

　　同時，通過算法和工程上的創(chuàng)新，DeepSeek-V3 的生成吐字速度從20 TPS大幅提高至 60 TPS，相比 V2.5 模型實現(xiàn)了3倍的提升。

　　該模型的訓練成本僅600萬美元，成本降低10倍，資源運用效率極高。

　　相比一個大模型公司，小米則是有很多應(yīng)用終端，手機、汽車等。根據(jù)2024年Q3財報顯示，小米集團的AIoT平臺已連接的IoT設(shè)備數(shù)超8.61億，同比增長23.2%。

　　雷軍親自挖人，意味著小米將重點投入AI。

商學院

Open Talk

消息稱雷軍千萬年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場景應(yīng)用？

相關(guān)閱讀

商學院

Open Talk

消息稱雷軍千萬年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場景應(yīng)用？

相關(guān)閱讀

消息稱雷軍千萬年薪招攬95后AI天才少女，大模型人才轉(zhuǎn)向場景應(yīng)用？