日本一级片在线播放_亚洲九九精品_日本一区二区三区国产_日韩免费高清视频

首頁 > 汽車活動 > 汽車活動 > 谷歌推出兩大數(shù)學模型,19秒解開IMO2024幾何問題

谷歌推出兩大數(shù)學模型,19秒解開IMO2024幾何問題

發(fā)布時間:2024-07-26 22:54:23

六道題每題可得7分,總分最高42分。谷歌DeepMind的人工智能系統(tǒng)在今年國際數(shù)學奧林匹克競賽中最終得分28分。今年金牌的門檻是29分,在正式比賽的609名選手中,58名達到了這一門檻。

DeepMind人工智能系統(tǒng)在IMO 2024上相對于人類競爭者的表現(xiàn)。在42分的總分中,人工智能系統(tǒng)獲得了28分。

谷歌DeepMind的AI模型解決了今年國際數(shù)學奧林匹克競賽(IMO)六個問題中的四個問題,人工智能首次達到了銀牌標準。

當?shù)貢r間7月25日,谷歌DeepMind公布專用于數(shù)學推理的模型AlphaProof,以及專注于幾何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解決了數(shù)學中的高級推理問題,具有先進數(shù)學推理能力的通用人工智能或開啟科學和技術的新領域。

IMO是歷史最悠久、規(guī)模最大、最負盛名的青年數(shù)學家競賽,自1959年以來每年舉辦一次。選手要解決代數(shù)、組合學、幾何和數(shù)論方面六個異常困難的問題。菲爾茲獎是數(shù)學家的最高榮譽之一,菲爾茲獎獲得者也會代表他們的國家參加IMO。

近年來,IMO競賽被認為是機器學習領域的重大挑戰(zhàn),也是衡量人工智能系統(tǒng)高級數(shù)學推理能力的理想基準。

谷歌DeepMind表示,IMO的數(shù)學問題被人工翻譯成數(shù)學語言,供系統(tǒng)理解。在正式比賽中,學生們分兩次提交答案,每次4.5小時。而人工智能系統(tǒng)在幾分鐘內(nèi)解決了一個問題,花了三天時間來解決其他問題。基于強化學習的推理系統(tǒng)AlphaProof解決了兩個代數(shù)問題和一個數(shù)論問題并被證明答案正確,這些問題包括今年IMO比賽中只有5名選手解決的最難的問題。AlphaGeometry 2證明了幾何問題,但兩個組合問題仍未解決。

六道題每題可得7分,總分最高可達42分。DeepMind的人工智能系統(tǒng)最終得分28分。DeepMind表示,今年金牌的門檻從29分開始,在正式比賽的609名選手中,有58名達到了這個門檻。

“事實上,這個程序能想出這樣一個不明顯的結構是非常令人印象深刻的,遠遠超出了我認為的最先進的水平。”IMO金牌得主和菲爾茲獎牌得主蒂莫西·高爾斯(Timothy Gowers)表示。

在大量書面文本上訓練的人工智能模型歷來在數(shù)學推理方面很困難,往往傾向于語言智能而非數(shù)學智能,解決數(shù)學問題需要更復雜的推理技能。AlphaProof將預先訓練好的語言模型與AlphaZero強化學習算法結合在一起,AlphaZero此前自學了如何掌握國際象棋、將棋和圍棋。

大語言模型容易產(chǎn)生幻覺,或以令人信服的方式傳遞錯誤信息。DeepMind表示,盡管基于自然語言的方法可以訪問更多數(shù)據(jù),但會產(chǎn)生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優(yōu)勢,即涉及數(shù)學推理的證明可以被形式化地驗證其正確性。“我們通過微調(diào)Gemini模型,在這兩個互補的領域之間建立了一座橋梁,自動將自然語言問題語句轉換為形式語句,創(chuàng)建了一個不同難度的龐大形式問題庫。”

當遇到一個數(shù)學問題時,AlphaProof會生成候選解決方案,然后搜索可能的證明步驟來證明或反駁它們。每一個被發(fā)現(xiàn)和驗證的證明都被用來強化AlphaProof的語言模型,增強其解決后續(xù)更具挑戰(zhàn)性問題的能力。

汽車活動更多>>

決勝高考|北京工業(yè)大學人工智能、微電子科學與工程實驗班招生政策解讀 豐田上海車展主題:直面問題所在,研產(chǎn)供銷全面中國化 同級唯一天地門,空間堪比A+級,東風納米06再次顛覆國民車 吉利銀河星耀8:以豪華平權,再創(chuàng)“爆款” 長安汽車,銷量漲了、利潤跌了 傳祺向往 M8 內(nèi)飾官圖發(fā)布!提供 7 座布局,搭載 2.0T 插混動力 方程豹鈦 3 將于 4 月 16 日上市!采用純電動力,配備一鍵漂移模式 廣汽 CC4 概念車官圖發(fā)布!配鷗翼門設計 新款 Jeep 大切諾基諜照曝光!外觀內(nèi)飾升級,定位中大型 SUV 汽車業(yè)加速重組并購最新成果:一汽或成零跑大股東 上汽之夜:懂車更懂你!上汽制造進階,共創(chuàng)美好出行 上汽大通G50混動:重塑10萬級MPV價值標準! 比亞迪580KW超級電機銘牌曝光:轉速30500轉/分鐘全球第一 2024年全年銷量3143.6萬輛,增長4.5%,47.5%新能源滲透率,585.9萬輛全球第一出口量 豐田純電車型終端售價“崩盤” 消息稱bZ3裸車只要9萬多 小鵬汽車新總部2025年啟用,辦公空間翻三倍,打造智能車庫 恢復序幕與尾聲,李六乙版話劇《雷雨》令人耳目一新 新華文創(chuàng)攜手FILA FUSION推出系列活動,用非遺開啟新年 游戲成為文旅新引擎?上海游戲賦能商旅文體展融合發(fā)展的實踐 晨光加速年輕化布局:聯(lián)動騰訊視頻《斬神》,力拓二次元千億藍海 廣州“賀·歲”今日開展,系海昏侯相關展覽首次在廣州展出 信也科技顧鳴:東南亞數(shù)字金融市場正在加速接近成熟地區(qū) 福特游騎俠Ranger FX4沙狐版來襲,越野性能再升級,售價28.58萬起 “一車抵三車” 長安啟源E07迎來OTA升級 優(yōu)雅的英國敞篷跑車,2門4座布局,V8發(fā)動機、665馬力、加速3.5s 宏光MINIEV四門版來襲,小巧便捷,女友直呼開車出門超方便! 溜背造型+掀背尾門,后置后驅(qū)+5.9秒破百,體驗東風風行星海S7 搭載全球最強電機 比亞迪唐L實車曝光:自帶車頂無人機艙 三菱翼神改裝AIRBFT氣動避震底盤升降案例 雙電機、四驅(qū)、650馬力,27英寸大屏,這內(nèi)飾看著可太有檔次了!