2025年是AI從早期浪潮步入中程階段的一年。

2025年末AI總結(jié):國(guó)民應(yīng)用和Cursor for X

2026-01-04 09:28:44發(fā)布     來(lái)源:多知    作者:周楓  

  編者按:

  本文為轉(zhuǎn)載,網(wǎng)易有道CEO周楓提到,2025年是AI從早期浪潮步入中程階段的一年。技術(shù)在繼續(xù)演進(jìn),故事開始回歸現(xiàn)實(shí)。因此,周楓也在年末之際選擇回望過(guò)去,談?wù)勥^(guò)去一年看到的行業(yè)變化、創(chuàng)業(yè)機(jī)會(huì)與個(gè)人感受。

  01 行業(yè)與模型

  中美AI國(guó)民應(yīng)用都已出現(xiàn)。不管是中國(guó)還是美國(guó),AI十年與移動(dòng)互聯(lián)網(wǎng)十年呈現(xiàn)出高度相似性:都會(huì)誕生跨年齡的大眾級(jí)超級(jí)應(yīng)用。

  OpenAI的ChatGPT從2022年末上線,通過(guò)免費(fèi)、手機(jī)App、語(yǔ)音模式、GPT Store等一系列升級(jí),2025年已是全球“國(guó)民應(yīng)用”。與之對(duì)照,豆包在2025年底日活突破一億,成為國(guó)內(nèi)真正意義上的國(guó)民級(jí)AI助手。不同在于:ChatGPT已深度商業(yè)化,而豆包、DeepSeek在C端仍完全免費(fèi),路徑尚未與ChatGPT完全重合。

  模型思考能力和智能體能力取得巨大進(jìn)展,多模態(tài)、長(zhǎng)記憶等能力相對(duì)停滯。2024年中的GPT-o1是第一個(gè)具有思考能力的模型,2025年初的DeepSeek R1開源給行業(yè)帶來(lái)巨大震撼,到2025年底,主流模型基本都具有了思考能力和多輪工具調(diào)用或者說(shuō)智能體(Agent)能力。國(guó)內(nèi)模型的多模態(tài)能力明顯落后于美國(guó)同行,而前沿模型本身在2025年多模態(tài)方面的進(jìn)展也不大,而長(zhǎng)記憶等更高級(jí)的能力在2025年也沒(méi)有明顯的進(jìn)展。

  前沿模型和開源模型保持了微妙平衡。以美國(guó)企業(yè)為主的前沿閉源模型在綜合能力上仍然保持領(lǐng)先,而以中國(guó)企業(yè)為代表的開源模型,則在成本、開放性與生態(tài)擴(kuò)散速度上形成了明顯優(yōu)勢(shì)。在LMSys Arena等公開評(píng)測(cè)榜單上(見文末附圖),2025年8月底前三名仍由美國(guó)前沿模型占據(jù),但前十名中已有五席由中國(guó)模型獲得,數(shù)量和活躍度均顯著提升。DeepSeek、通義千問(wèn)、智譜、MiniMax、Kimi等廠商在過(guò)去一年里頻繁迭代開源模型與低價(jià)API策略,使其在全球開發(fā)者社區(qū)快速傳播,并在海外市場(chǎng)取得可見進(jìn)展,已經(jīng)成為不少硅谷創(chuàng)業(yè)公司的主力模型選擇之一。

  大模型之外的其它模型也可以很有價(jià)值。2025年行業(yè)最具存在感的意外,來(lái)自 Google 在 8 月推出的 Nano Banana。它在圖像生成與編輯領(lǐng)域展現(xiàn)出極高的一致性與質(zhì)量,直接打開了電商展示、廣告創(chuàng)意、產(chǎn)品設(shè)計(jì)等嚴(yán)肅商業(yè)場(chǎng)景。它所傳遞的信息很清晰:除了通用大模型之外,圍繞視覺(jué)、視頻、音頻、翻譯等具體任務(wù)打造的專業(yè)模型,同樣可以孕育出大規(guī)模應(yīng)用與可觀的商業(yè)價(jià)值。

  這一方向,也是我們長(zhǎng)期關(guān)注并持續(xù)投入的路徑。2025年,有道詞典的AI同傳功能在“子曰”翻譯模型驅(qū)動(dòng)下,使用量實(shí)現(xiàn)數(shù)量級(jí)增長(zhǎng),體現(xiàn)出非 LLM 的專業(yè)模型在垂直任務(wù)中的效果與性價(jià)比優(yōu)勢(shì)。因此,我們非??春眠@類“專用能力模型”的發(fā)展?jié)摿Α?026 年,視頻與語(yǔ)音等領(lǐng)域是否會(huì)出現(xiàn)類似級(jí)別的突破,值得持續(xù)關(guān)注。

  02 應(yīng)用與創(chuàng)業(yè)

  AI與移動(dòng)互聯(lián)網(wǎng)技術(shù)最大的區(qū)別在于,模型本身即是應(yīng)用。移動(dòng)互聯(lián)網(wǎng)時(shí)代的生態(tài)結(jié)構(gòu)相對(duì)分層清晰——基礎(chǔ)設(shè)施(如通信網(wǎng)絡(luò)、操作系統(tǒng)、應(yīng)用市場(chǎng))與上層應(yīng)用之間存在明顯分工,大部分基礎(chǔ)技術(shù)公司并不會(huì)直接深入消費(fèi)端產(chǎn)品。AI時(shí)代的格局則有不同:到目前為止,頭部企業(yè)大多選擇從底層模型能力一路延伸到終端產(chǎn)品,推動(dòng)“模型+工具 +平臺(tái)+應(yīng)用”的一體化布局。

  Anthropic是典型代表:底層通過(guò)Opus/Sonnet/Haiku等系列模型構(gòu)建推理引擎;中間層向開發(fā)者提供Claude API和Claude Enterprise;上層則有面向終端用戶的Claude、面向開發(fā)者和工程師的Claude Code。Claude Code自2025年初推出后,上線6個(gè)月ARR即達(dá)到10億美元,不僅證明了“模型能力本身的商業(yè)價(jià)值”,更意味著“圍繞模型構(gòu)建產(chǎn)品和工作流能夠產(chǎn)生規(guī)模化收入”。這種從模型到產(chǎn)品的縱向整合,在 AI市場(chǎng)占據(jù)了大體量的用戶、數(shù)據(jù)和收入份額,是與移動(dòng)互聯(lián)網(wǎng)時(shí)代顯著不同的結(jié)構(gòu)特點(diǎn)。

  場(chǎng)景比模型能力更重要,機(jī)會(huì)在于把大型需求用AI重做。在大型剛需場(chǎng)景中,我認(rèn)為有一些是模型廠商的機(jī)會(huì),有一些是純應(yīng)用團(tuán)隊(duì)的機(jī)會(huì)??梢钥吹降囊恍┓较虬ǎ核阉鳌⒎g、個(gè)人助理、娛樂(lè)與陪伴、辦公自動(dòng)化、知識(shí)管理、法律/醫(yī)療/編程等專業(yè)工作、個(gè)性化學(xué)習(xí)、教育內(nèi)容生產(chǎn)、營(yíng)銷與獲客、智能客服、決策支持、視頻生產(chǎn)、圖像設(shè)計(jì)與數(shù)據(jù)處理等。真正的門檻,正在從“能力演示”轉(zhuǎn)向“重構(gòu)工作流”。

  “Cursor for X”是創(chuàng)業(yè)的好目標(biāo)。關(guān)于尋找什么樣的場(chǎng)景切入,我認(rèn)為Cursor這個(gè)案例很值得研究。Anysphere(Cursor)是當(dāng)前體量最大的“應(yīng)用起家”AI公司:以AI化IDE為切入口,重構(gòu)開發(fā)工作流,從需求理解、代碼生成到調(diào)試與重構(gòu)形成閉環(huán),從而帶來(lái)強(qiáng)付費(fèi)意愿與高使用粘性。Cursor 的成功,使“Cursor for X”(即在某一垂直領(lǐng)域打造一個(gè)Cursor)逐漸成為投資人與創(chuàng)始人之間的常用提法——把Cursor的方法論復(fù)制到律師、金融、教育、創(chuàng)作等高價(jià)值流程中。沿著這一路徑,已經(jīng)出現(xiàn)了一批具有代表性的產(chǎn)品:Harvey面向法律服務(wù)、Den面向知識(shí)工作者工作臺(tái),NotebookLM面向知識(shí)整理與學(xué)習(xí),它們都不再只是“在原有產(chǎn)品上加一個(gè)聊天框”,而是以 AI 為核心,對(duì)某一專業(yè)工具進(jìn)行從工作流層面的重塑。這一類產(chǎn)品的共性在于:把模型、工具調(diào)用與上下文管理深度結(jié)合,真正提高單位時(shí)間產(chǎn)出,而不僅僅提供“回答問(wèn)題”的界面。

  會(huì)員是成熟的變現(xiàn)形式,廣告是未知的變量。ChatGPT已證明“生產(chǎn)力工具訂閱”具有強(qiáng)商業(yè)可行性;國(guó)內(nèi)頭部產(chǎn)品則多保持 C 端免費(fèi),利用低價(jià) API 與開源生態(tài)協(xié)同擴(kuò)大影響力。中小型AI應(yīng)用目前主要采用「基礎(chǔ)免費(fèi)+高階會(huì)員/訂閱」的Freemium模式。至于聊天式AI助手是否會(huì)走向廣告化變現(xiàn),仍存在較大不確定性:廣告與“可信、專注、為我工作的助手”這一產(chǎn)品心智能否共存,既是產(chǎn)品設(shè)計(jì)問(wèn)題,也是商業(yè)模式問(wèn)題。這很可能會(huì)成為 2026 年 AI 應(yīng)用生態(tài)中的重要觀察變量之一。

  03 算力

  一個(gè)好應(yīng)用往往消耗大量token。從2024到2025,全球token消耗量持續(xù)指數(shù)級(jí)上升,復(fù)雜任務(wù)的平均調(diào)用深度和自動(dòng)化比例都在顯著提高。以中國(guó)市場(chǎng)為例,2024年1月到2025年6月,日均token消耗量從約 1000 億增長(zhǎng)到約 30 萬(wàn)億,增幅 300 倍(國(guó)家數(shù)據(jù)局?jǐn)?shù)據(jù))。

  我個(gè)人判斷,在未來(lái)五年內(nèi),國(guó)內(nèi) token 使用量保持“年十倍級(jí)增長(zhǎng)”是大概率事件。我常和同事打趣說(shuō) Claude 是“編程 5 分鐘,等待 5 小時(shí)”——token 消耗極快,用盡后只能等額度刷新。但這個(gè)現(xiàn)象的另一面,是應(yīng)用形態(tài)的變化:越來(lái)越多工作不是“人工 + 輔助生成”,而是直接交由模型自主跑完整個(gè)流程。只要算力價(jià)格繼續(xù)下降,那些今天看似“燒錢”的智能編程、智能體和圖像視頻生成應(yīng)用,未來(lái)反而會(huì)成為最具護(hù)城河和商業(yè)價(jià)值的方向。

  非GPU架構(gòu)的芯片值得關(guān)注。從Intel擬收購(gòu) SambaNova,到NVIDIA授權(quán)Groq IP并吸納核心團(tuán)隊(duì),背后的共同信號(hào)是:在以推理為主的AI應(yīng)用時(shí)代,算力格局不太可能只由 GPU 一種架構(gòu)長(zhǎng)期主導(dǎo)。SambaNova 采用數(shù)據(jù)流(dataflow)為核心的專用加速器路線,強(qiáng)調(diào)在特定模型上的高效率;Groq 則以“語(yǔ)言處理單元(LPU)”為特色,主打極高吞吐和確定性延遲,適合大規(guī)模低延遲推理。

  國(guó)內(nèi)本就存在GPU與NPU、ASIC等多架構(gòu)并行發(fā)展的格局。如果未來(lái)非GPU架構(gòu)在功耗與成本上持續(xù)拉開差距,并與特定應(yīng)用(如推理、邊緣部署)深度結(jié)合,那么完全有可能形成一個(gè)具有差異化優(yōu)勢(shì)的獨(dú)立算力體系,而不是單一GPU的簡(jiǎn)單補(bǔ)充。

  04 個(gè)人

  程序員職業(yè)被顛覆是大概率事件。2025年是編程模型大發(fā)展的一年,年初還無(wú)法看清是否機(jī)器真的會(huì)編程,年末它已經(jīng)能接管很多開發(fā)流程。這種變化對(duì)行業(yè)的沖擊是結(jié)構(gòu)性的,我自己也在不斷思考由此帶來(lái)的生產(chǎn)方式調(diào)整與人才培養(yǎng)轉(zhuǎn)向。

  對(duì)于以編程為職業(yè)的人士,以及即將進(jìn)入這一行業(yè)的學(xué)生,我有兩點(diǎn)建議。第一,要盡量把能力上移到更高層級(jí):系統(tǒng)設(shè)計(jì)、架構(gòu)把控以及對(duì)業(yè)務(wù)的深入理解,逐步超越簡(jiǎn)單頁(yè)面搭建、腳手架生成等重復(fù)性強(qiáng)且易被自動(dòng)化替代的工作。第二,要盡快掌握并熟練使用新一代工具:Agent、Skills、MCP、LSP,以及prompting與context engineering等方法論,并把它們?nèi)谌肴粘?shí)踐。能夠指揮 AI 高效完成復(fù)雜任務(wù),將會(huì)成為未來(lái)程序員最基礎(chǔ)也最重要的能力。

  愿我們都在變化的時(shí)代里,找到屬于自己的答案。新年快樂(lè)。

  附:LMSys Arena模型排名

IMG_7669.jpeg