可以展示教科書中的數(shù)學(xué)問題并要求分步解決方案。

OpenAI的ChatGPT語音助手擁有視覺功能了,適用于教育場景

2024-12-14 09:06:25發(fā)布     來源:多知    作者:Penny  

  多知12月14日消息,本周四,是在OpenAI 為期 12 天的盛會(huì)的第六天,該公司在直播中表示,其為 ChatGPT 開發(fā)的類似人類的對(duì)話功能“ChatGPT Advanced Voice (高級(jí)語音模式)”正在實(shí)現(xiàn)視覺化,Advanced Voice由OpenAI的多模態(tài)模型GPT-4o支持。這意味著OpenAI 終于發(fā)布了近七個(gè)月前演示的ChatGPT實(shí)時(shí)視頻功能,但目前不是向全部用戶開放。

  同時(shí),OpenAI宣布,整個(gè) 12 月,ChatGPT Advanced Voice 都會(huì)獲得新的圣誕老人“Ho Ho Ho”的聲音。第一次使用時(shí),OpenAI 甚至?xí)⒂脩舻?Advanced Voice 消息重置為零,以便用戶可以通話更長時(shí)間。

  使用 ChatGPT 應(yīng)用,訂閱ChatGPT Plus、Team或Pro 的用戶可以將手機(jī)對(duì)準(zhǔn)物體,ChatGPT 會(huì)近乎實(shí)時(shí)地做出響應(yīng)。

  帶視覺的ChatGPT Advanced Voice還可以通過屏幕共享了解設(shè)備屏幕上的內(nèi)容。例如,展示案例中給咖啡壺拍照讓ChatGPT教授如何制作手沖咖啡。用戶還可以上傳植物的照片并詢問養(yǎng)護(hù)技巧,或者展示教科書中的數(shù)學(xué)問題并要求分步解決方案。

WechatIMG13.jpg

  今年5月,OpenAI在推出GPT-4o時(shí)演示了語音模式Voice Mode。可以說,這種多模態(tài)的交互方式非常適合教育場景,當(dāng)時(shí),OpenAI展示這項(xiàng)功能時(shí)就邀請(qǐng)了Salman Khan讓GPT-4o輔導(dǎo)兒子Imran學(xué)習(xí)數(shù)學(xué)的視頻,GPT-4o會(huì)聽會(huì)說會(huì)看。

  要使用視覺進(jìn)入ChatGPT Advanced Voice,點(diǎn)擊 ChatGPT 聊天欄旁邊的語音圖標(biāo),然后點(diǎn)擊左下角的視頻圖標(biāo),即可開始視頻。要共享屏幕,點(diǎn)擊三點(diǎn)菜單并選擇“共享屏幕”。

  ChatGPT Advanced Voice支持50多種語言,展現(xiàn)AI陪伴工具體驗(yàn)感提升,為AI教育工具示范。

  不過,OpenAI 表示,帶視覺的高級(jí)語音模式本周四開始推出,并于下周結(jié)束。但并非所有用戶都能獲得訪問權(quán)限。

  此外,OpenAI 表示,ChatGPT Enterprise 和 Edu 用戶要到明年 1 月才能獲得該功能,而且對(duì)于歐盟、瑞士、冰島、挪威等ChatGPT 用戶,它還沒有時(shí)間表。

  除了帶視覺的高級(jí)語音模式外,OpenAI 周四還推出了節(jié)日“圣誕老人模式”,該模式將圣誕老人的聲音作為 ChatGPT 中的預(yù)設(shè)語音添加。用戶可以通過點(diǎn)擊或單擊 ChatGPT 應(yīng)用中提示欄旁邊的雪花圖標(biāo)來找到它。

  在OpenAI 為期 12 天的盛會(huì)已經(jīng)進(jìn)行了7天,很多預(yù)覽產(chǎn)品已經(jīng)正式推出,包括視頻模型Sora、ChatGPT o1模型等。