AI的每一步嘗試進(jìn)展,都是對(duì)未來(lái)教育的想象空間的開(kāi)拓.

大模型能答對(duì)幾道高考數(shù)學(xué)題?國(guó)產(chǎn)九章大模型PK國(guó)際GPT-4o

2024-06-12 13:02:24發(fā)布     來(lái)源:多知網(wǎng)    作者:Amy  

  又是一年高考時(shí),除文作文題目,其他的題你還能看懂嘛?

  你也許不懂,但大模型可以!

  隨著人工智能技術(shù)的飛速發(fā)展,人工智能AI在各個(gè)領(lǐng)域的應(yīng)用越來(lái)越廣泛,“大模型做高考題”也成了一大看點(diǎn)。

  大模型因?yàn)槭亲匀徽Z(yǔ)言模型,“重文輕理”是普遍情況,但也有大模型主攻數(shù)學(xué)能力。今天的測(cè)試,讓專攻數(shù)學(xué)的國(guó)產(chǎn)九章大模型(MathGPT)和OpenAI最新的大模型GPT-4o一起做今年的數(shù)學(xué)題,以2024全國(guó)甲卷數(shù)學(xué)高考真題為例,看看結(jié)果會(huì)怎樣?

  01

  九章大模型略勝一籌,仍有較大提升空間

  先來(lái)看結(jié)論:

  【九章大模型(MathGPT)】

  選擇題12題,做對(duì)7題。

  填空題4題,做對(duì)2題。

  九章大模型總分= 7 * 5分 + 2 * 5分  = 45分 (滿分90分)

  【GPT-4o】

  選擇題12題,正確7題。

  填空題4題,正確1題。

  GPT-4o總分= 7 * 5分 + 1 * 5分  = 40分 (滿分90分)

  GPT-4o是OpenAI在今年5月14日推出的最新大模型,GPT-4o在處理速度上提升了高達(dá)200%,GPT-4o所有功能包括視覺(jué)、聯(lián)網(wǎng)、記憶、執(zhí)行代碼以及GPT Store等,可以實(shí)時(shí)對(duì)音頻、視覺(jué)和文本進(jìn)行推理。

  學(xué)而思九章大模型(MathGPT)是學(xué)而思自主研發(fā)的,面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),以解題和講題算法為核心的大模型。2023年 11 月,九章大模型成為首批通過(guò)備案的教育大模型。

  本次測(cè)試題目?jī)H針對(duì)《2024年高考全國(guó)甲卷數(shù)學(xué)真題》。由于數(shù)學(xué)解答題的評(píng)分考核步驟過(guò)程,答題準(zhǔn)確與否不易評(píng)判,所以只針對(duì)有明確答案的選擇題和填空題來(lái)測(cè)試。

  在測(cè)試中我們發(fā)現(xiàn),文本輸入格式的不同,會(huì)對(duì)測(cè)試結(jié)果造成比較明顯的干擾。于是此次測(cè)試采用了上傳圖片文本識(shí)別的方式,讓大模型識(shí)別題目并做題,更能保證結(jié)果的公平客觀。同時(shí),這種識(shí)圖的方式也更類似“人類視覺(jué)讀題”的真實(shí)狀態(tài),是對(duì)大模型能力的全面考驗(yàn)。

  從結(jié)論來(lái)看,九章大模型作為以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心的大模型,在高考數(shù)學(xué)題目上更勝一籌,比GPT-4o得分更高。同時(shí)“點(diǎn)睛”分析也是九章大模型的特色,在解題的同時(shí)還拆解了題目的考點(diǎn),更適合給學(xué)習(xí)者作為參考。

  但從絕對(duì)值的分?jǐn)?shù)來(lái)看,兩個(gè)大模型的整體答題分?jǐn)?shù)都不算太高。大模型做數(shù)學(xué)題仍是一個(gè)難度較大的挑戰(zhàn),短期的模型表現(xiàn)還達(dá)不到完美,但在逐步攻克數(shù)學(xué)問(wèn)題的路上,AI的每一步嘗試進(jìn)展,都是對(duì)未來(lái)教育的想象空間的開(kāi)拓,值得更多耐心與期待。

  02

  選擇題:九章大模型、GPT-4o互有勝負(fù)

  2024年高考全國(guó)甲卷數(shù)學(xué)題共12道選擇題,九章大模型和GPT-4o都是有7道正確,但做對(duì)的題目不完全相同,互有勝負(fù)。

 

WX20240612-130549.png

  選擇題  具體來(lái)看幾道題:

  第2題,九章大模型做對(duì),GPT-4o做錯(cuò):

  原題:

001.png

  九章大模型解答:

002.png

  GPT-4o解答:

 003.png

  第9題,九章大模型做對(duì),GPT-4o認(rèn)為沒(méi)有正確答案:

  原題:

004.png

  九章大模型解答:

 005.png

  GPT-4o解答

圖片

011.png

  第10題,九章大模型做錯(cuò),GPT-4o做對(duì):

  原題:

圖片

  九章大模型解答:

  

圖片

  GPT-4o解答,答案選擇正確,但其中解題對(duì)命題①的分析存在錯(cuò)誤:

  

圖片

  03

  填空題:GPT-4o做對(duì)一道,九章做對(duì)兩道

WX20240612-131410.png  

  具體來(lái)看兩道題:

  第14題,九章大模型和GPT-4o都做對(duì):

  原題:

  

圖片

  九章大模型解答:

  

圖片

  GPT-4o解答:

  

圖片

  第16題,九章大模型做對(duì),GPT-4o做錯(cuò)

  原題:

  

圖片

  九章大模型解答:

  

圖片

  GPT-4o解答:

  

圖片