北京中考試卷出爐，來看九章大模型對決GPT-4o —廣東站—beplay2網頁登錄 - beplay2网页登录,beplay官网网页,beplay体育手机

beplay2網頁登錄中國教育網

要聞政策高考 beplay中心錢包體育錢包教師學術橋財會

更多

掌上高考掌上beplay中心錢包體育錢包學業橋就業橋職教網 beplay體育手機

手機端

掌上高考

掌上beplay中心錢包體育錢包

學術橋

beplay2網頁登錄

熱門服務

高招服務研招服務人才服務學業生涯職教招考繼續教育就業服務高教科創課程思政教學服務輿情服務

教育資訊

合作電話：186 1028 4700

合作郵箱：bianji@eol.cn

官方微博：@beplay2網頁登錄

官方微信ID：eoleoleol

beplay2網頁登錄

beplay2網頁登錄

首頁> 廣東分站> 廣東基礎教育

首頁> 廣東分站> 廣東基礎教育

北京中考試卷出爐，來看九章大模型對決GPT-4o

2024-07-01 18:55:00

https://www.eol.cn

關注beplay2網頁登錄

beplay2網頁登錄公眾號

　　繼高考之後,各地中考也陸續落下帷幕。之前,多家機構和媒體用高考題評測大模型們的“高考成績”,吸引了不少眼球。那麵對中考題,尤其是大模型不太擅長的數學科目,又會有怎樣的結果呢?

　　讓我們以今年北京中考數學試卷為例,再測一下大模型們的答題實力吧!

　　今天的測試“選手”分別是國產九章大模型和GPT-4o大模型。九章大模型(MathGPT),是學而思自主研發,麵向全球數學愛好者和科研機構,以解題和講題算法為核心的大模型。此前在Matheval排行榜多個維度的評測中都排名第一。GPT-4o是由OpenAI公司研發,是國際上備受關注的大語言模型之一,除了自然語言處理,GPT-4o還具備一定的推理能力,能夠處理需要邏輯分析和判斷的問題。

　　究竟誰在這場“數學比拚”中更勝一籌,讓我們一起看看。

　　一、先說結論

　　本次測試選擇了2024年北京中考數學試卷中的17道題,分別是8道選擇題、8道填空題以及1道解答題。

　　在測試題目的比拚中,九章大模型的正確率為85%,GPT-4o的正確率為75%。

　　【九章大模型(MathGPT)】

　　選擇題8題,做對5題。

　　填空題8題,做對6題。

　　九章大模型總分 = 5 * 2分 + 6* 2分+1分 = 23分 (滿分30分)

　　【GPT-4o】

　　選擇題8題,正確5題。

　　填空題8題,正確5題。

　　GPT-4o總分 = 5* 2分 + 5* 2分 = 20分 (滿分30分)

　　注:填空題的最後一題有兩問共2分,答對一問記1分。

　　在這次AI比拚中,九章大模型憑借其在數學領域的專業優勢,取得了較高的正確率。這表明在特定領域,尤其是數學解題,定製化的大模型能夠展現出更強的性能。然而,兩者在複雜圖題上的表現都存在不足,說明在這類問題的邏輯推理和步驟展示上,AI仍有待提升。

　　從教育的角度看,AI大模型為學習者提供了及時反饋和考點解析,有助於增強學習體驗和深度理解。但同時,AI的局限性也提醒我們,它目前還不能完全替代人類教師的角色,尤其是在精細化指導和情感交流層麵。

　　未來,AI與教育的結合可能會推動教學模式的創新,如人機協同教學以及自適應學習路徑等。要實現這些願景,AI技術需要在保證準確性和普適性的同時,進一步增強其在複雜情境下的理解和應用能力。

　　二、測試方法

　　1、測試題目:2024年北京中考數學試卷選擇題的第1-8題,填空題的第9-16題,解答題第26題。

　　2、由於數學解答題的評估涉及複雜的推理步驟和邏輯判斷,直接評判模型答案的正確性較為困難。因此,本次測試的重點放在了選擇題和填空題上,這些題目通常有明確的正確答案,便於公正地評估模型的解答能力。

　　三、選擇題,難分伯仲

　　以一道經典的概率推論題為例,一起來看一下二者的分析過程

　　九章大模型如下作答:

　　GPT-4o分析思路:

　　四、填空題,九章大模型獲勝

　　第14題,GPT-4o回答錯誤

　　九章大模型正確解答:

　　GPT-4o的分析過程:

　　第16題,均出現錯誤

　　九章大模型隻答對了第一問,其分析過程:

　　GPT-4o兩問均回答錯誤,其解答過程:

　　五、解答題

　　第26題,九章大模型最終答案正確。

　　九章大模型的分析過程:

　　GPT-4o最終答案有誤,其分析過程:

免責聲明：

① 凡本站注明“稿件來源：beplay2網頁登錄”的所有文字、圖片和音視頻稿件，版權均屬本網所有，任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站，在下載使用時必須注明“稿件來源：beplay2網頁登錄”，違者本站將依法追究責任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿，本站轉載出於非商業性的教育和科研之目的，並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題，請作者在兩周內速來電或來函聯係。

教育資訊

廣東2024年報考軍隊院校普通高中畢業生麵試...

2024年廣東定向培養軍士體檢分數線公布

廣東各高校多少分能上？廣東省2024年各校預...

更正！2024廣東高考招生目錄有變！

廣東省2024年高校特殊類型招生專業目錄

上海考生多少分能上中山大學？

廣東2024年高考什麼時候報誌願？截止日期？

6月28日報誌願！廣東2024年高考誌願填報時間...

基礎教育

北京中考試卷出爐，來看九章大模型對決GPT-4o

希沃聯合師範院校開展“人工智能+”師範生網...

聚焦“學校製度改進與組織變革”——第二期...

正念減壓，沉著應考　——《紅姐姐信箱》團...

2024中國“芯”助力中國夢全國青少年通信科...

2024第十四屆華南幼教展開幕

廣州開發區第二小學：與微笑學子共赴一場民...

智慧課堂樂互動技術賦能謀發展——記廣州市...

高等教育

廣東最美高校“校花”排行榜來啦～快來pick...

2024年廣東優質高職院校進高中招生谘詢會來啦

beplay2網頁登錄《2024學校高質量發展》訪談專題

廣東高職2024年春季招生計劃彙總

beplay2網頁登錄“廣東好大學進高中”活動彙總

抓住誌願填報關鍵期，讀上廣州熱門大學熱門...

廣東工貿職業技術學院2024年夏季高考招生專...

beplay2網頁登錄·掌上高考2024年夏季招生谘詢...

相關新聞