可生成32種語言的自然聲音。
多知10月14日消息,人工智能芯片制造巨頭 NVIDIA 投資了英國獨(dú)角獸公司 ElevenLabs,后者從事人工智能生成的語音和音頻技術(shù),目前,ElevenLabs可生成32種語言的自然聲音,并用于媒體、出版和教育領(lǐng)域。
ElevenLabs 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Mati Staniszewski 在視頻中證實(shí)了這一交易,但并未透露財(cái)務(wù)細(xì)節(jié)。
此次投資表明客戶對于類人AI語音的需求日益增長,也表明英偉達(dá)對生成式 AI 生態(tài)系統(tǒng)的興趣日益濃厚,尤其是在改變品牌與客戶互動方式的應(yīng)用程序方面。
ElevenLabs 成立于 2022 年,因其先進(jìn)的 AI 語音合成平臺而備受關(guān)注,該平臺可以創(chuàng)建多種語言、口音和情感語調(diào)的超逼真語音。無論是敘述,還是有聲讀物,還是畫外音,都可以用到AI語音。
該技術(shù)將深度學(xué)習(xí)與專有的語音克隆和配音技術(shù)相結(jié)合,使企業(yè)能夠通過語音渠道提供實(shí)時(shí)個性化、自然的交互和輔助工具。
ElevenLabs 上周宣布繼續(xù)擴(kuò)展其在英國和美國的業(yè)務(wù)。該公司在搭載 NVIDIA Blackwell 圖形處理器 (GPU) 和加速軟件的系統(tǒng)上訓(xùn)練其文本轉(zhuǎn)語音和語音轉(zhuǎn)文本 AI 模型,并與該公司合作開發(fā)新技術(shù)。
英偉達(dá)首席執(zhí)行官黃仁勛去年在臺北國際電腦展上利用 ElevenLabs 的 AI 語音和語音克隆技術(shù),以英語和普通話講述了他的主題演講的幾個章節(jié)。據(jù)該公司稱,他僅用七分鐘的錄音,不到一小時(shí)就創(chuàng)作出了這個聲音。
黃仁勛在視頻中說道:“每當(dāng)我的聲音通過人工智能以數(shù)字方式傳遞時(shí),我都會使用 ElevenLabs 平臺。語音轉(zhuǎn)文本只是一門技術(shù)。而文本轉(zhuǎn)語音則是一門藝術(shù);是融入到產(chǎn)品中的一門技藝,與技術(shù)緊密結(jié)合。”
他補(bǔ)充道:“傳遞情感的同時(shí),你也在傳遞同理心,而當(dāng)你傳遞同理心時(shí),你就是在傳遞聯(lián)系。所以,人工智能能夠捕捉到這些情感的能力非常不可思議。”
Mati Staniszewski在視頻中表示,他預(yù)計(jì)人工智能將很快通過對話的圖靈測試,這將允許聊天機(jī)器人和Agent以在流程、語氣和理解方面與人類難以區(qū)分的方式與客戶互動。
ElevenLabs 為自動化服務(wù)交互和擴(kuò)展多語言支持開辟了新的可能性。
ElevenLabs 在今年 1 月的上一輪融資中籌集了 1.8 億美元,當(dāng)時(shí)公司估值達(dá)到 33 億美元。