AI 助手從單純的指令響應(yīng)向更自主的任務(wù)執(zhí)行邁出了重要一步。

Claude 推出電腦操作功能,向 Agent 方向邁進

2026-03-24 10:02:39發(fā)布     來源:多知    作者:Penny  

  多知3月24日消息,AI 公司Anthropic 旗下AI助手 Claude 推出了一項新功能“Computer Use”(電腦使用),允許用戶授權(quán)其直接操作電腦完成各類任務(wù)。這一更新標(biāo)志著 AI 助手從單純的指令響應(yīng)向更自主的任務(wù)執(zhí)行邁出了重要一步。

  該功能集成在兩款桌面產(chǎn)品中:面向知識工作者的 Claude Cowork,以及面向開發(fā)者的 Claude Code。用戶描述任務(wù)后,Claude 會自主規(guī)劃步驟,依次打開應(yīng)用、操作瀏覽器、處理文件——包括鼠標(biāo)點擊和鍵盤輸入。每次執(zhí)行前,界面會展示操作計劃并等待用戶確認(rèn),用戶可隨時中斷。

  

  同時,Dispatch 是 Computer Use 的一個入口,允許用戶通過手機向 Computer Use 分配任務(wù)。

  可以說,“Computer Use”功能幾乎涵蓋日常辦公場景中用戶在電腦前能完成的所有操作。該功能旨在幫助用戶更高效地管理工作流程:用戶可以在手機上分配任務(wù),轉(zhuǎn)而處理其他事務(wù),稍后回到電腦前時,便能看到任務(wù)已完成。

  Claude 表示,“Computer Use”與“Dispatch”功能配合使用效果更好,用戶可以通過手機向Claude分配任務(wù)。這些任務(wù)包括每天早上查看電子郵件,或打開Claude Cowork或Claude Code會話。

  Anthropic 公司還表示,例如,該組合功能可以生成晨間簡報或運行測試等。

  鑒于這兩項功能都是新增的,一些復(fù)雜的任務(wù)可能無法一次性成功完成。

  Claude 優(yōu)先調(diào)用已連接的第三方集成,如 Slack、Calendar、Notion、GitHub 等;沒有對應(yīng)連接器時才會申請屏幕訪問權(quán)限,直接操控應(yīng)用界面。

  目前,該功能以研究預(yù)覽的形式向 Pro 和 Max 用戶開放,僅支持 macOS 系統(tǒng)。

  這不是 Anthropic 第一次做 Computer Use。 2024 年 10 月,基于 Claude 3.5 Sonnet 的 API 版 Computer Use 已進入公測。今年初,Cowork 預(yù)覽版加入了桌面文件處理能力。此次將手機 Dispatch 與屏幕控制整合,是這條產(chǎn)品線迭代到可用階段的節(jié)點。

  但Claude的新功能并非是OpenClaw的競爭對手。

  Claude推出的Computer Use和 Dispatch不是“一個新的 AI 產(chǎn)品”,而是“給現(xiàn)有的 Claude Cowork/Claude Code 增加了一個遠(yuǎn)程控制入口”。它的核心邏輯是:你已經(jīng)有了 Claude Cowork或者Claude Code,現(xiàn)在你可以用手機給它派活了。

  

  也就是說,Claude 現(xiàn)有的操作入口依然保留,文件仍存放在原處,配置好的工具也仍在 Cowork 環(huán)境中供 Claude 執(zhí)行任務(wù)。手機只是變成了一個輕量級的指令面板。

  

  OpenClaw是一個需要用戶自己部署、自己配置、自己接入模型和聊天軟件的完整框架。

  越來越多的大模型向Agent的方向邁進。

  今年2月,OpenClaw 創(chuàng)始人 Peter Steinberger 加入了 OpenAI,將負(fù)責(zé)推動“下一代個人智能體”的研發(fā) 。

  近日,據(jù)《華爾街日報》報道,OpenAI正在開發(fā)一款桌面“超級應(yīng)用”,該應(yīng)用將整合其三大核心工具:ChatGPT、編程平臺Codex和Atlas瀏覽器。OpenAI高管表示,推出這款新桌面應(yīng)用的目標(biāo)是改善用戶體驗。

  而在中國,阿里巴巴、百度、字節(jié)跳動、騰訊、Kimi、MiniMax 在內(nèi)的科技巨頭也已紛紛入局,推出了各自的“類OpenClaw(龍蝦)”智能體產(chǎn)品。

  從上述動態(tài)可以看出,當(dāng)前 AI Agent 賽道正在形成兩條清晰的技術(shù)路線。

  一條是“官方集成路線”,以 Anthropic 的 Computer Use 為代表。這類方案的特點是“開箱即用”:由大模型廠商直接提供從模型到應(yīng)用層的完整閉環(huán),用戶無需技術(shù)背景即可使用,但會被鎖定在單一模型生態(tài)中。

  這類產(chǎn)品的核心邏輯是“為現(xiàn)有產(chǎn)品增加入口”,強調(diào)的是易用性和產(chǎn)品體驗的流暢度。

  另一條是“開源框架路線”,以 OpenClaw 為代表。這類方案將“調(diào)度層”與“模型層”分開,用戶可以自由選擇 Claude、GPT 或本地模型作為“大腦”,再通過 Telegram、微信等渠道下達(dá)指令。要求用戶具備一定的技術(shù)部署能力。

  值得注意的是,中國科技巨頭推出的“龍蝦”可以算是“開源框架路線”,但做了“改造”,從用戶“自己動手部署”變成了“開箱即用的產(chǎn)品服務(wù)”。