OpenAI的ChatGPT語音助手擁有視覺功能了，適用于教育場景

2024-12-14 09:06:25發(fā)布來源：多知作者：Penny

　　多知12月14日消息，本周四，是在OpenAI 為期 12 天的盛會(huì)的第六天，該公司在直播中表示，其為 ChatGPT 開發(fā)的類似人類的對話功能“ChatGPT Advanced Voice (高級(jí)語音模式)”正在實(shí)現(xiàn)視覺化，Advanced Voice由OpenAI的多模態(tài)模型GPT-4o支持。這意味著OpenAI 終于發(fā)布了近七個(gè)月前演示的ChatGPT實(shí)時(shí)視頻功能，但目前不是向全部用戶開放。

　　同時(shí)，OpenAI宣布，整個(gè) 12 月，ChatGPT Advanced Voice 都會(huì)獲得新的圣誕老人“Ho Ho Ho”的聲音。第一次使用時(shí)，OpenAI 甚至?xí)⒂脩舻?Advanced Voice 消息重置為零，以便用戶可以通話更長時(shí)間。

　　使用 ChatGPT 應(yīng)用，訂閱ChatGPT Plus、Team或Pro 的用戶可以將手機(jī)對準(zhǔn)物體，ChatGPT 會(huì)近乎實(shí)時(shí)地做出響應(yīng)。

　　帶視覺的ChatGPT Advanced Voice還可以通過屏幕共享了解設(shè)備屏幕上的內(nèi)容。例如，展示案例中給咖啡壺拍照讓ChatGPT教授如何制作手沖咖啡。用戶還可以上傳植物的照片并詢問養(yǎng)護(hù)技巧，或者展示教科書中的數(shù)學(xué)問題并要求分步解決方案。

　　今年5月，OpenAI在推出GPT-4o時(shí)演示了語音模式Voice Mode。可以說，這種多模態(tài)的交互方式非常適合教育場景，當(dāng)時(shí)，OpenAI展示這項(xiàng)功能時(shí)就邀請了Salman Khan讓GPT-4o輔導(dǎo)兒子Imran學(xué)習(xí)數(shù)學(xué)的視頻，GPT-4o會(huì)聽會(huì)說會(huì)看。

　　要使用視覺進(jìn)入ChatGPT Advanced Voice，點(diǎn)擊 ChatGPT 聊天欄旁邊的語音圖標(biāo)，然后點(diǎn)擊左下角的視頻圖標(biāo)，即可開始視頻。要共享屏幕，點(diǎn)擊三點(diǎn)菜單并選擇“共享屏幕”。

　　ChatGPT Advanced Voice支持50多種語言，展現(xiàn)AI陪伴工具體驗(yàn)感提升，為AI教育工具示范。

　　不過，OpenAI 表示，帶視覺的高級(jí)語音模式本周四開始推出，并于下周結(jié)束。但并非所有用戶都能獲得訪問權(quán)限。

　　此外，OpenAI 表示，ChatGPT Enterprise 和 Edu 用戶要到明年 1 月才能獲得該功能，而且對于歐盟、瑞士、冰島、挪威等ChatGPT 用戶，它還沒有時(shí)間表。

　　除了帶視覺的高級(jí)語音模式外，OpenAI 周四還推出了節(jié)日“圣誕老人模式”，該模式將圣誕老人的聲音作為 ChatGPT 中的預(yù)設(shè)語音添加。用戶可以通過點(diǎn)擊或單擊 ChatGPT 應(yīng)用中提示欄旁邊的雪花圖標(biāo)來找到它。

　　在OpenAI 為期 12 天的盛會(huì)已經(jīng)進(jìn)行了7天，很多預(yù)覽產(chǎn)品已經(jīng)正式推出，包括視頻模型Sora、ChatGPT o1模型等。

商學(xué)院

Open Talk

OpenAI的ChatGPT語音助手擁有視覺功能了，適用于教育場景

相關(guān)閱讀

商學(xué)院

Open Talk

OpenAI的ChatGPT語音助手擁有視覺功能了，適用于教育場景

相關(guān)閱讀

OpenAI的ChatGPT語音助手擁有視覺功能了，適用于教育場景