星火大模型預計10月底在中文上超越ChatGPT。
多知網(wǎng)5月11日消息,科大訊飛星火大模型發(fā)布后于9日和11日連續(xù)舉辦了兩場投資者活動,透露了星火大模型的商業(yè)落地規(guī)劃,相應的時間節(jié)點,回應了相關“套殼OpenAI的ChatGPT”的問題。
科大訊飛提到,在發(fā)布了星火大模型后,首批來自36個行業(yè)的3000余家企業(yè)開發(fā)者已經(jīng)達成了明確的合作意向。
針對網(wǎng)上有謠言說訊飛星火大模型“套殼OpenAI的ChatGPT”,科大訊飛回應稱:既不符合事實,也不符合邏輯:如果是套殼ChatGPT,就不可能出現(xiàn)訊飛星火大模型的響應速度比ChatGPT還快;更不會出現(xiàn)訊飛星火大模型在文本生成、知識問答、數(shù)學能力等方面的結(jié)果均優(yōu)于ChatGPT的情況。
科大訊飛透露,接下來星火大模型的具體迭代周期是:
6月9日:突破開放式問答(即實時問答),通過類搜索插件獲取知識,以更人性化的方式呈現(xiàn)。此外,升級多輪對話能力,數(shù)學能力還會再上一個新的臺階。
8月15日:升級代碼能力,讓開發(fā)者、合作伙伴高效方便使用,訊飛內(nèi)部已經(jīng)在使用代碼生成能力。同時,多模態(tài)交互能力正式開放給客戶。
10月24日(科大訊飛全球開發(fā)者節(jié)):通過科學、系統(tǒng)的評測方法在通用認知大模型能力上能夠?qū)薈hatGPT,在中文上超越,在英文上達到跟它相當?shù)乃健?/strong>
以下為投資者活動問答實錄(為方便閱讀,多知網(wǎng)將兩次投資者活動進行了整合):
問:訊飛星火大模型的相關情況,具體在商業(yè)落地上如何規(guī)劃?
答:1、星火大模型是科大訊飛在人工智能領域長期深耕而產(chǎn)生的技術(shù)復利效應?;诳拼笥嶏w在認知智能領域超過十年的積累,訊飛星火大模型經(jīng)科學、系統(tǒng)的評測,在國內(nèi)可測的現(xiàn)有系統(tǒng)中處于領先水平;
2、星火大模型帶來公司已有產(chǎn)品的競爭力提升和用戶體驗的顯著改善,進一步提高了產(chǎn)品的剛需屬性,還提供了公司參與互聯(lián)網(wǎng)產(chǎn)業(yè)格局重塑的新機遇;
3、5月6日發(fā)布會上現(xiàn)場展示的學習機、辦公本、錄音筆、聽見,以及汽車人機交互、數(shù)字員工等具體的產(chǎn)品,均已實現(xiàn)了星火大模型的商業(yè)模式落地。
相關產(chǎn)品應用星火大模型的技術(shù)成果后,銷量顯著提升。除了賦能自身產(chǎn)品外,訊飛會繼續(xù)開放AI能力,聯(lián)合各行業(yè)合作伙伴面向多個行業(yè)共建大模型“星火”生態(tài)。本次發(fā)布會首批來自36個行業(yè)的3000余家企業(yè)開發(fā)者已經(jīng)達成了明確的合作意向。
問:當詢問訊飛星火,“你是誰”或者“你和OpenAI的關系”時,經(jīng)常會錯誤出現(xiàn)ChatGPT相關的信息,請問原因是什么,如何改進?
答:1、這是大模型常見的模型人設問題:大模型不堅持自己的觀點,對于一些客觀的事實,會聽從用戶的意見,受到用戶干擾。這是現(xiàn)有大模型的已知和常見問題。也有投資者截圖反饋給我們GPT對于“gpt-4是誰開發(fā)的”的答復為“gpt-4是由科大訊飛公司開發(fā)的”。
訊飛星火認知大模型為公司自主研發(fā),使用了海量數(shù)據(jù)訓練,但由于ChatGPT比較火,訓練數(shù)據(jù)中出現(xiàn)較多OpenAI、ChatGPT等詞匯,因而在有些問答中會錯誤地出現(xiàn)以上信息。
2、網(wǎng)上有謠言說訊飛星火大模型“套殼OpenAI的ChatGPT”既不符合事實,也不符合邏輯:如果是套殼ChatGPT,就不可能出現(xiàn)訊飛星火大模型的響應速度比ChatGPT還快;更不會出現(xiàn)訊飛星火大模型在文本生成、知識問答、數(shù)學能力等方面的結(jié)果均優(yōu)于ChatGPT的情況。
3、公司研究團隊正在積極解決該問題,預計6月9日的版本在這類問題上會有大幅度改善。
問:公司ChatGPT相關技術(shù)在算法方面的優(yōu)勢?
答:1、科大訊飛構(gòu)建了一支成建制的、行業(yè)頂尖的研發(fā)團隊。主主導星火大模型研發(fā)的主力部隊多是85后、90后,既年富力強,也多在一線擁有10年以上的專業(yè)研究經(jīng)驗,其中有兩位員工甚至入選《麻省理工科技評論》“35歲以下科技創(chuàng)新35人”榜單,這是中國乃至全球科技領域的最高榮譽;
2、依托科大訊飛唯一一家承建認知智能全國重點實驗室,在Transformer深度神經(jīng)網(wǎng)絡算法方面擁有豐富經(jīng)驗。已廣泛應用于科大訊飛的語音識別、圖文識別、機器翻譯等任務并達到國際領先水平,2022年在認知智能技術(shù)領域累計獲得13項世界冠軍;2022年7月,科大訊飛既創(chuàng)新提出了大模型與知識融合統(tǒng)一的理解框架X-Reasoner,有望彌補大模型的模糊記憶技術(shù)短板;
3、算法的創(chuàng)新要依托具體的應用持續(xù)場景迭代,科大訊飛在認知智能方面開拓了豐富的應用場景。例如教育行業(yè)的因材施教和個性化學習、醫(yī)療行業(yè)的人工智能輔診、智慧城市的便民便企服務、面向企事業(yè)單位的智能辦公等等,過去3年已實現(xiàn)合計超過兩百億的毛利額。
問:目前市場上有一些測試集來驗證各家大模型的效果,現(xiàn)在是否有相對權(quán)威的測評體系?
答:一套科學、系統(tǒng)的評測體系是非常必要的,認知智能全國重點實驗室牽頭設計了通用認知大模型評測體系,并與中科院人工智能產(chǎn)學研創(chuàng)新聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類481個細分任務類型。
主要包括:1、多風格、多任務的長文本生成能力;2、多層次跨語種語言理解;3、泛領域開放式知識問答;4、情境式思維鏈邏輯推理;5、多題型可解析數(shù)學能力;6、多功能多語言代碼能力;7、多模態(tài)輸入和表達能力。
問:5.6發(fā)布會以后,訊飛星火大模型后續(xù)持續(xù)的里程碑目標?
答:5月6日發(fā)布會上劉慶峰董事長已經(jīng)提到,各家大模型技術(shù)均仍存在有待攻克的三類技術(shù)缺陷:新知識難以及時更新、事實類問答容易“張冠李戴”、史實傳統(tǒng)典籍等容易“編造情節(jié)”。
發(fā)布會后,我們將持續(xù)升級迭代,具體里程碑:
6月9日:突破開放式問答(即實時問答),通過類搜索插件獲取知識,以更人性化的方式呈現(xiàn)。此外,升級多輪對話能力,數(shù)學能力還會再上一個新的臺階。
8月15日:升級代碼能力,讓開發(fā)者、合作伙伴高效方便使用,訊飛內(nèi)部已經(jīng)在使用代碼生成能力。同時,多模態(tài)交互能力正式開放給客戶。
10月24日(科大訊飛全球開發(fā)者節(jié)):通過科學、系統(tǒng)的評測方法在通用認知大模型能力上能夠?qū)薈hatGPT,在中文上超越,在英文上達到跟它相當?shù)乃健?/strong>
問:公司教育業(yè)務發(fā)展情況?
答:1、科大訊飛區(qū)域因材施教項目是全國唯一一家有實際案例、實際數(shù)據(jù)效果驗證的廠商,重大項目實現(xiàn)了100%規(guī)?;虒W質(zhì)量提升;基于良好的應用成效,已經(jīng)逐步延伸到二期、三期項目,呈現(xiàn)出向周邊區(qū)域輻射效果;
2、G端業(yè)務的規(guī)模化應用及其良好的應用成效,進一步形成了良好的GBC聯(lián)動效應;
3、訊飛AI學習機真正擁有因材施教、個性化分析的AI能力,真正能夠減負并增效,市場份額和品牌知名度持續(xù)提升,NPS值持續(xù)保持第一。
問:請問學習機的發(fā)展情況?
答:科大訊飛AI學習機自上市以來,得到用戶和行業(yè)的高度認可。在競爭激烈的學習機行業(yè)中,科大訊飛AI學習機市場份額和品牌知名度持續(xù)提升,用戶凈推薦值NPS持續(xù)保持行業(yè)第一。今年發(fā)布的AI學習機T20Pro全新上市,為3-8歲、8-12歲、12-18歲的孩子分別匹配啟蒙益智精準學、自主輔學精準學、學業(yè)提升精準學,通過環(huán)環(huán)相扣的“個性特征識別-自主閉環(huán)學習-真實效果反饋”三大模塊幫助孩子減輕學業(yè)負擔、提升學業(yè)水平,實現(xiàn)閉環(huán)且螺旋上升的自主學習。5月6日,科大訊飛AI學習機T20Pro作為認知智能大模型技術(shù)率先落地的產(chǎn)品之一,進一步提高了產(chǎn)品核心競爭力,銷量顯著增長。