日本一级片在线播放_亚洲九九精品_日本一区二区三区国产_日韩免费高清视频

首頁(yè) > 汽車(chē)生活 > 汽車(chē)生活 > OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

發(fā)布時(shí)間:2024-09-16 16:27:04

OpenAI 發(fā)布 o1-mini:更經(jīng)濟(jì)高效的推理模型

OpenAI 推出 o1-mini,一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型。o1-mini 在數(shù)學(xué)和編碼方面表現(xiàn)出色,接近 OpenAI o1 的水平,同時(shí)成本更低,速度更快。

一、o1-mini 簡(jiǎn)介

  • OpenAI o1-mini 是一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,尤其擅長(zhǎng)數(shù)學(xué)和編碼。
  • o1-mini 在 AIME 和 Codeforces 等評(píng)估基準(zhǔn)測(cè)試中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延遲更低,速率限制更高。

二、o1-mini 的優(yōu)勢(shì)

  • STEM 領(lǐng)域推理能力強(qiáng) :o1-mini 經(jīng)過(guò)專(zhuān)門(mén)優(yōu)化,在 STEM 領(lǐng)域表現(xiàn)出色,尤其在數(shù)學(xué)和編碼方面。
  • 成本效益高 :o1-mini 比大型語(yǔ)言模型更小,因此運(yùn)行成本更低,更適合實(shí)際應(yīng)用。
  • 速度更快 :o1-mini 的響應(yīng)速度比大型語(yǔ)言模型更快,例如在單詞推理問(wèn)題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現(xiàn)

領(lǐng)域

基準(zhǔn)測(cè)試

o1-mini

o1-preview

o1

GPT-4o

數(shù)學(xué)

AIME

70.0%

44.6%

74.4%

-

編碼

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科學(xué))

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 數(shù)學(xué)競(jìng)賽中取得了 70.0% 的成績(jī),與 o1 (74.4%) 相當(dāng),并優(yōu)于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 編碼競(jìng)賽中獲得了 1650 Elo 的評(píng)分,與 o1 (1673) 相當(dāng),并高于 o1-preview (1258)。
  • 在一些需要推理能力的學(xué)術(shù)基準(zhǔn)測(cè)試中,例如 GPQA (科學(xué)) 和 MATH-500,o1-mini 的表現(xiàn)優(yōu)于 GPT-4o。
  • 在人類(lèi)偏好評(píng)估中,o1-mini 在需要推理能力的領(lǐng)域優(yōu)于 GPT-4o,但在語(yǔ)言類(lèi)領(lǐng)域則不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用與 o1-preview 相同的對(duì)齊和安全技術(shù)進(jìn)行訓(xùn)練。
  • 在內(nèi)部版本的 StrongREJECT 數(shù)據(jù)集上,o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標(biāo)

GPT-4o

o1-mini

對(duì)有害提示的拒絕率(標(biāo)準(zhǔn))

0.99

0.99

對(duì)有害提示的安全完成率(挑戰(zhàn):越獄和邊緣案例)

0.714

0.932

對(duì)良性邊緣案例的合規(guī)性(“不過(guò)度拒絕”)

0.91

0.923

Goodness@0.1 StrongREJECT 越獄評(píng)估

0.22

0.83

人工來(lái)源的越獄評(píng)估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主題(如日期、傳記和冷知識(shí))方面的知識(shí)儲(chǔ)備有限。

六、未來(lái)展望

  • OpenAI 將在未來(lái)版本中改進(jìn) o1-mini 在非 STEM 領(lǐng)域的知識(shí)儲(chǔ)備。
  • OpenAI 還將嘗試將 o1-mini 擴(kuò)展到其他模態(tài)和 STEM 以外的專(zhuān)業(yè)領(lǐng)域。

OpenAI o1-mini 是一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,在數(shù)學(xué)和編碼方面表現(xiàn)出色。o1-mini 比大型語(yǔ)言模型更經(jīng)濟(jì)、更快,是需要推理能力但對(duì)世界知識(shí)要求不高的應(yīng)用的理想選擇。

來(lái)源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 發(fā)布,注重隱私保護(hù)的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發(fā)布! 這是 LibreOffice 24.8 系列的第一個(gè)次要版本 ,適用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特點(diǎn)

  • 注重隱私: LibreOffice 24.8 系列專(zhuān)為注重隱私的辦公套件用戶而優(yōu)化,他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰(shuí)共享他們創(chuàng)建的內(nèi)容。
  • 功能豐富: LibreOffice 提供了一系列界面選項(xiàng),以適應(yīng)不同的用戶習(xí)慣,從傳統(tǒng)到現(xiàn)代,并通過(guò)優(yōu)化桌 面上的可用空間,最大限度地利用不同的屏幕尺寸,只需點(diǎn)擊一兩次即可實(shí)現(xiàn)最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技術(shù)引擎,可提供更好的用戶體驗(yàn),并生成基于兩種可用 ISO 標(biāo)準(zhǔn)的相同且完全可互操作的文檔:開(kāi)放文檔格式 (ODT、ODS 和 ODP) 和專(zhuān)有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企業(yè)級(jí)支持: TDF 強(qiáng)烈推薦生態(tài)系統(tǒng)合作伙伴提供的 LibreOffice Enterprise 系列應(yīng)用程序,適用于桌面、移動(dòng)和云,具有廣泛的專(zhuān)用增值功能和其他優(yōu)勢(shì),例如 SLA。

汽車(chē)生活更多>>

吉利銀河星耀8:以豪華平權(quán),再創(chuàng)“爆款” 奇瑞混動(dòng)技術(shù)大秀,沖擊1升油耗 上汽之夜:技術(shù)平權(quán)定義出行文明,中國(guó)方案重構(gòu)全球汽車(chē)秩序 汽車(chē)智能化狂飆遭質(zhì)疑,上汽要用更懂用戶的方式步入下半場(chǎng) 50萬(wàn)買(mǎi)奧迪S5,修車(chē)比保養(yǎng)還勤,奧迪售后該醒醒了! 智能化內(nèi)卷時(shí)代,英仕派的“恰到好處”才是真香 盤(pán)點(diǎn):奇瑞汽車(chē)混動(dòng)之夜上發(fā)布的新技術(shù)和新產(chǎn)品 奇瑞混動(dòng)之夜:中國(guó)技術(shù)定義全球標(biāo)準(zhǔn),開(kāi)源計(jì)劃引領(lǐng)產(chǎn)業(yè)革命 現(xiàn)在“出海”,理想汽車(chē)能找到“理想”的海外市場(chǎng)嗎? 車(chē)展為何誕生于上海? Gartner預(yù)測(cè):2025年電動(dòng)汽車(chē)出貨量將增長(zhǎng) 17% 奇瑞風(fēng)云A9即將盲訂:超5米混動(dòng)四驅(qū)中大型車(chē) 加拿大電動(dòng)汽車(chē)退稅計(jì)劃提前終止,資金耗盡促車(chē)企自補(bǔ) 騰勢(shì)Z9GT第1萬(wàn)輛正式交付:最快交付破萬(wàn)的新能源豪華轎車(chē) 委員談AI+教育,“不怕學(xué)生用得多,怕他們不會(huì)用” 運(yùn)動(dòng)與生活早已密不可分,他是身體力行的“體育人” 春運(yùn)開(kāi)啟,昆明長(zhǎng)水機(jī)場(chǎng)應(yīng)對(duì)即將到來(lái)的出入境客流高峰 深圳二手房交易量重新站上6萬(wàn)套關(guān)口,樓市新政后連現(xiàn)5個(gè)“日光盤(pán)” 點(diǎn)燃數(shù)字引擎,加大場(chǎng)景創(chuàng)新,蘇州工行打造數(shù)字人民幣生態(tài)體系新篇章 他從上海到西藏定日,希望一點(diǎn)點(diǎn)平息孩子們心中的“余震” 比亞迪唐L插混版的全新升級(jí),如何重新定義家用SUV? 小米YU7純電SUV來(lái)襲,3040萬(wàn)價(jià)位能否引領(lǐng)新潮流? 堅(jiān)守駕駛樂(lè)趣 進(jìn)階數(shù)字智能 寶馬集團(tuán)以堅(jiān)實(shí)市場(chǎng)表現(xiàn)邁向新世代 阿斯頓·馬丁Vantage Roadster來(lái)襲,6.8秒敞篷開(kāi)合,性能與顏值并存! 換裝新發(fā)動(dòng)機(jī)并增加ABS,新大洲本田NS125LA升級(jí) 多項(xiàng)功能升級(jí) 長(zhǎng)安啟源E07迎1.1版本OTA升級(jí) 比亞迪夏入局MPV,GL8、塞納、夢(mèng)想家等曾經(jīng)的優(yōu)勢(shì)車(chē)型該如何應(yīng)對(duì) 敞篷開(kāi)/關(guān)只要6.8s?兄弟們先看看!沒(méi)準(zhǔn)今年就開(kāi)上了! 2025年溫州市財(cái)稅會(huì)計(jì)學(xué)校招聘公告 2025年杭州市第三人民醫(yī)院招聘工作人員公告