“國(guó)產(chǎn)全自研、中文能力比肩GPT-4”

新一代基座大模型GLM-4來了!智譜AI將發(fā)起大模型開源基金

2024-01-17 12:29:58發(fā)布     來源:多知網(wǎng)    作者:Penny  

  多知網(wǎng)1月17日消息,智譜AI16日舉辦首屆技術(shù)開放日(Zhipu DevDay)。現(xiàn)場(chǎng),智譜AI團(tuán)隊(duì)全面展示了其投身于大模型事業(yè)三年多來所積累的技術(shù)成果,并重磅發(fā)布了新一代基座大模型GLM-4。

  根據(jù)此次GLM-4的發(fā)布及上線,是智譜AI大模型研發(fā)上的關(guān)鍵突破。智譜AI首席執(zhí)行官?gòu)堸i介紹,GLM-4的整體性能相比上一代大幅提升,逼近GPT-4。它可以支持更長(zhǎng)的上下文,具備更強(qiáng)的多模態(tài)能力。同時(shí),它的推理速度更快,支持更高的并發(fā),大大降低推理成本。除此之外,GLM-4大幅提升了智能體能力,GLM-4 All Tools 實(shí)現(xiàn)自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復(fù)雜任務(wù)。GLMs 個(gè)性化智能體定制功能亦同時(shí)上線,用戶用簡(jiǎn)單的提示詞指令就能創(chuàng)建屬于自己的 GLM 智能體。

c21f9af0e7e82d06276239755b0079b9.jpg

  具體來說,GLM-4可以支持128k的上下文窗口長(zhǎng)度,單次提示詞可以處理的文本可以達(dá)到300頁。同時(shí),在needle test(大海撈針)測(cè)試中,128K文本長(zhǎng)度內(nèi)GLM-4 模型均可做到幾乎100%的精度召回,并未出現(xiàn)長(zhǎng)上下文全局信息因?yàn)槭Ы苟鴮?dǎo)致的精度下降問題。同時(shí),多模態(tài)能力方面,文生圖和多模態(tài)理解都得到了增強(qiáng)。

  此外,GLM-4的All Tools能力全新發(fā)布。得益于GLM模型的強(qiáng)大Agent能力,GLM-4實(shí)現(xiàn)了自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和文生圖CogView3模型。同時(shí),GLM-4 通過代碼解釋器,會(huì)自動(dòng)調(diào)用代碼解釋器進(jìn)行復(fù)雜的方程或者微積分求解。對(duì)比GSM8K、Math以及Math23K三個(gè)數(shù)據(jù)集上的結(jié)果,GLM-4 All Tools取得和GPT-4 All Tools相當(dāng)?shù)男Ч?。GLM-4的All Tools能力完全自動(dòng),而且可以處理各種任務(wù),比如包括文件處理、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù),支持處理 Excel、PDF、PPT 等格式的文件。

  GLMs個(gè)性化智能體定制能力也同步上線?;贕LM-4模型的強(qiáng)大能力,用戶只要登錄智譜清言官方網(wǎng)站,用簡(jiǎn)單的提示詞指令就能創(chuàng)建屬于自己的GLM智能體。并且,用戶可以通過全新上線的智能體中心分享自己創(chuàng)建的各種智能體。GLM模型智能體的推出標(biāo)志著任何人都能夠自由運(yùn)用GLM-4模型并挖掘它的潛力,沒有任何編程基礎(chǔ)也能夠?qū)崿F(xiàn)大模型的便捷開發(fā)。這是智譜AI為降低大模型使用門檻所做的最新努力。

WechatIMG33.jpg

  此前,智譜AI分別聯(lián)合CCF中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)社會(huì)媒體處理專委會(huì)發(fā)起了CCF-智譜大模型基金、SMP-智譜大模型交叉學(xué)科基金,用于支持大模型理論、算法、模型、應(yīng)用等相關(guān)研究和跨領(lǐng)域交叉創(chuàng)新。去年兩支基金為來自全國(guó)三十余所高校參與的41個(gè)研究項(xiàng)目累計(jì)提供了超1000萬元現(xiàn)金和算力資源的科研支持。

  2024年,智譜AI也將發(fā)起開源開放的大模型開源基金,該計(jì)劃包括三個(gè)“一千”:智譜AI將為大模型開源社區(qū)提供一千張卡,助力開源開發(fā);提供1000萬元的現(xiàn)金用來支持與大模型相關(guān)的開源項(xiàng)目;為優(yōu)秀的開源開發(fā)者提供1000億免費(fèi)API tokens。張鵬表示,大模型開源基金的目的在于推動(dòng)大模型研發(fā)的大進(jìn)展,促進(jìn)大模型整個(gè)開源生態(tài)的大繁榮。面對(duì)全球的大模型創(chuàng)業(yè)者,智譜AI也將“Z計(jì)劃”進(jìn)一步升級(jí),聯(lián)合生態(tài)伙伴發(fā)起總額10億人民幣的大模型創(chuàng)業(yè)基金用于支持大模型原始創(chuàng)新,覆蓋大模型算法、底層算子、芯片優(yōu)化、行業(yè)大模型和超級(jí)應(yīng)用等方向

  2024年被業(yè)界普遍認(rèn)為是人工智能發(fā)展歷史上的又一重要年份。張鵬認(rèn)為,2024將是AGI元年。他表示:“大模型創(chuàng)新研發(fā)是一條長(zhǎng)征路,一枝獨(dú)秀不是春,我們希望與人工智能行業(yè)所有的參與者、產(chǎn)業(yè)鏈上下游合作伙伴、開發(fā)者社區(qū)、學(xué)術(shù)界一同努力,為中國(guó)AI新未來貢獻(xiàn)綿薄之力。”

  智譜AI于2020年底開始研發(fā)GLM預(yù)訓(xùn)練架構(gòu),2021年訓(xùn)練完成百億參數(shù)模型GLM-10B,同年利用MoE架構(gòu)成功訓(xùn)練出收斂的萬億稀疏模型,2022年合作研發(fā)了中英雙語千億級(jí)超大規(guī)模預(yù)訓(xùn)練模型GLM-130B。2023年,智譜AI推出了基于千億基座的對(duì)話模型ChatGLM,并開源單卡版模型ChatGLM-6B,使得研究者和個(gè)人開發(fā)者進(jìn)行本地微調(diào)和部署成為可能。

  目前,針對(duì)B端企業(yè)的模型訓(xùn)練、微調(diào)、部署等服務(wù),是智譜AI的主要業(yè)務(wù)形式,其合作伙伴包括有道、火山引擎等。

  公開資料顯示,智譜AI是國(guó)內(nèi) AI 領(lǐng)域獨(dú)角獸企業(yè),其背后的投資方包括美團(tuán)、阿里、螞蟻集團(tuán)、高瓴資本等多家投資機(jī)構(gòu)。(多知網(wǎng) Penny)