英偉達(dá)正為人形機(jī)器人公司開發(fā)一個(gè)綜合的AI平臺(tái)。
*英偉達(dá)GTC大會(huì)炸裂了,研發(fā)最新進(jìn)展曝光
*消息稱蘋果正與谷歌商討在iPhone中嵌入Gemini
*「Open-Sora 1.0」全球首個(gè)類Sora視頻生成模型開源
*摩根士丹利任命首位AI主管
*李開復(fù):海外已有AI超級(jí)應(yīng)用出現(xiàn),絕不投資傳統(tǒng)APP+AI
*拖拽P圖技術(shù)再升級(jí):南大、騰訊聯(lián)合推出StableDrag
1、英偉達(dá)GTC大會(huì),公布多項(xiàng)技術(shù)進(jìn)展
在英偉達(dá)GTC(GPU Technology Conference)大會(huì)上,黃仁勛發(fā)表主題演講《見證AI的變革時(shí)刻》。在兩個(gè)小時(shí)的演講中,黃仁勛圍繞五大板塊,介紹了英偉達(dá)的最新研發(fā)進(jìn)展:新的產(chǎn)業(yè)發(fā)展、Blackwell平臺(tái)、創(chuàng)新軟件NIMs、AI平臺(tái)NEMO和AI工坊(AI foundry)服務(wù),以及仿真平臺(tái)Omniverse和適用于通用機(jī)器人的 Project GROOT技術(shù)。英偉達(dá)還透露了對(duì)其 Nvidia Isaac 機(jī)器人平臺(tái)的升級(jí),旨在使機(jī)器人手臂比以往更智能、更靈活、更高效。
在本屆英偉達(dá)GTC大會(huì)上,英偉達(dá)展示了多款由GROOT驅(qū)動(dòng)的機(jī)器人,它們可以通過觀察人類的行為來理解自然語言和模仿運(yùn)動(dòng)。據(jù)英偉達(dá)透露,公司正在為領(lǐng)先的人形機(jī)器人公司開發(fā)一個(gè)綜合的AI平臺(tái),如1X Technologies、Agility Robotics、Apptronik、波士頓動(dòng)力公司、Figure AI、傅利葉智能、Sanctuary AI、宇樹科技和小鵬鵬行等。
黃仁勛透露,英偉達(dá)擁有 1000 多名機(jī)器人開發(fā)人員。他說:“機(jī)器人領(lǐng)域出現(xiàn)ChatGPT時(shí)刻的可能性近在咫尺,我們已經(jīng)花了一段時(shí)間來構(gòu)建端到端的機(jī)器人系統(tǒng)。”
2、消息稱蘋果正與谷歌商討在iPhone中嵌入Gemini
據(jù)彭博社報(bào)道,援引知情人士透露,蘋果正在同谷歌進(jìn)行談判,商討在iPhone中嵌入谷歌的Gemini人工智能引擎。知情人士還稱,蘋果近期還與OpenAI進(jìn)行了討論,并考慮使用其模型。
蘋果和谷歌以及OpenAI均暫未置評(píng)。
3、全球首個(gè)類Sora視頻生成模型全面開源
Github技術(shù)社區(qū)顯示,「Open-Sora 1.0」全球首個(gè)類Sora視頻生成模型全面開源,包括訓(xùn)練細(xì)節(jié)和模型權(quán)重,復(fù)現(xiàn)成本僅1萬美元;模型采用Diffusion Transformer架構(gòu),優(yōu)化空間-時(shí)間注意力機(jī)制,大幅降低訓(xùn)練和推理開銷,提升視頻生成質(zhì)量;多階段訓(xùn)練策略有效降低成本,提升視頻內(nèi)容生成的時(shí)長(zhǎng)、分辨率和保真度,支持高效訓(xùn)練加持,進(jìn)一步優(yōu)化視頻生成效果。
4、摩根士丹利任命首位AI主管
CNBC稱,摩根士丹利任命了其首位全公司層面的AI主管Jeff McMillan,以推動(dòng)AI技術(shù)在公司中的實(shí)施。這一舉措反映了金融服務(wù)行業(yè)開始調(diào)整組織架構(gòu),以AI驅(qū)動(dòng)公司發(fā)展。去年,摩根士丹利基于OpenAI的 GPT-4為員工創(chuàng)建解決方案,今年可謂是動(dòng)作加快。
據(jù)稱,Jeff McMillan將與業(yè)務(wù)部門和基礎(chǔ)設(shè)施領(lǐng)域合作,確定人工智能機(jī)會(huì)并確定優(yōu)先順序;幫助公司在整個(gè)行業(yè)的人工智能開發(fā)流程中定位。
5、李開復(fù):海外已有AI超級(jí)應(yīng)用出現(xiàn),不是“AI First”應(yīng)用絕不投資
創(chuàng)新工場(chǎng)董事長(zhǎng)、零一萬物 CEO 李開復(fù)出席2024 瀾舟科技大模型技術(shù)和產(chǎn)品發(fā)布會(huì),并發(fā)表《AI 2.0 平臺(tái)變革進(jìn)行式》主題演講。
李開復(fù)拋出了以下觀點(diǎn):
今天世界最好的大模型,已經(jīng)接近人類平均智商的三倍。
殺手級(jí)應(yīng)用已經(jīng)有了,而且以后會(huì)越來越多。微信、TikTok、Instagram等,做到1億級(jí)用戶,需要8-30個(gè)月。而美國(guó)已經(jīng)有兩個(gè)AI應(yīng)用,僅用6個(gè)月就達(dá)到了1億用戶。
純移動(dòng)時(shí)代的應(yīng)用,將成為過去式。AI 2.0通過了圖靈測(cè)試,將賦能所有的應(yīng)用,并帶來一個(gè)平臺(tái)級(jí)的變革。
每一個(gè)最偉大的、能創(chuàng)造最大價(jià)值、用戶量最多、能最快達(dá)到1億用戶的應(yīng)用,一定都是原生的 AI First 應(yīng)用。創(chuàng)新工場(chǎng)未來3年,不是“AI First”應(yīng)用絕不投資!
如果只是在移動(dòng)互聯(lián)網(wǎng)或PC應(yīng)用基礎(chǔ)上加上一個(gè) AI 助手,就不是真的真正的AI First、AI Native。真正的AI First是把大模型拿掉后,整個(gè)應(yīng)用就不工作、不存在了。
AI將從虛擬世界走向真實(shí)世界。未來10 年, AI將無所不在,而且會(huì)讓人類所有的工作任務(wù),發(fā)生翻天覆地的改變。(騰訊科技、i黑馬)
6、拖拽P圖技術(shù)再升級(jí):南大、騰訊聯(lián)合推出StableDrag
南京大學(xué)和騰訊開發(fā)了StableDrag,通過判別式點(diǎn)跟蹤和基于置信的潛在增強(qiáng)策略,提升了拖拽P圖技術(shù)的穩(wěn)定性和準(zhǔn)確性;StableDrag優(yōu)化了長(zhǎng)程操縱穩(wěn)定性和高質(zhì)量操縱點(diǎn)定位,能精確移動(dòng)和編輯圖像中的特定部分;在廣泛的定性和定量評(píng)估中,StableDrag展現(xiàn)出比先前方法更穩(wěn)定和高質(zhì)量的拖拽效果,提供了新的圖像編輯模型StableDrag-GAN和StableDrag-Diff。(機(jī)器之心)