OpenAI王炸新一波:向開發(fā)者開放滿血o1,測試中全面超越人類博士專家 ,準(zhǔn)確率達(dá)到78.3%
來源:每日經(jīng)濟(jì)新聞2024-12-18 07:39

在人工智能領(lǐng)域,英偉達(dá)再次引領(lǐng)技術(shù)革新,于當(dāng)?shù)貢r間12月17日推出了Jetson Orin Nano Super,一款手掌大小的生成式AI超級計算機(jī)。這款僅售249美元的開發(fā)者套件,以其卓越的性能和親民的價格,為商業(yè)AI開發(fā)者、愛好者和學(xué)生提供了一個強(qiáng)大的工具。英偉達(dá)CEO黃仁勛強(qiáng)調(diào),Jetson Orin Nano Super的性能提升了70%,每秒可執(zhí)行高達(dá)67萬億次的INT8運算。

同時,OpenAI也不甘示弱,推出了最強(qiáng)推理模型o1,其在多個基準(zhǔn)測試中超越人類專家,預(yù)示著通用人工智能(AGI)的進(jìn)一步發(fā)展。

OpenAI王炸新一波:向開發(fā)者開放滿血o1,全面超越人類博士專家

在為期12個工作日的線上新品和新技術(shù)發(fā)布活動中,OpenAI的王炸又來了一波:將OpenAI的最強(qiáng)推理模型o1向開發(fā)者開放,用于開發(fā)語音類App的API中納入了收費更低的先進(jìn)模型GPT-4o版本。

今年9月,OpenAI 發(fā)布了o1的預(yù)覽版o1 preview,稱o1是第一個具備真正通用推理能力的大模型,它的核心能力推理在測試化學(xué)、物理和生物學(xué)專業(yè)知識的基準(zhǔn)GPQA-diamond上得到了充分體現(xiàn)。

據(jù)OpenAI的評估,o1在該測試中全面超過了人類博士專家,準(zhǔn)確率達(dá)到78.3%,而人類專家的得分為69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經(jīng)沒有任何阻礙”。此外,o1在多個高難度的推理基準(zhǔn)測試中表現(xiàn)優(yōu)異,例如在美國數(shù)學(xué)邀請賽(AIME)中,o1的正確率達(dá)到了83.3%,遠(yuǎn)超其前身GPT-4o的表現(xiàn)。

12月5日,OpenAI在預(yù)告的連續(xù)12日王炸發(fā)布活動首日就推出了正式版的o1,所謂滿血o1,它被納入ChatGPT Plus套餐。正式版o1支持多模態(tài)輸入,具備視覺推理能力。相比o1 preview版本,正式版o1的平均響應(yīng)速度快了60%,OpenAI還發(fā)現(xiàn)正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。

在包括編碼、數(shù)學(xué)和視覺推理任務(wù)在內(nèi)的一系列基準(zhǔn)測試中,正式版o1都相比預(yù)覽版取得了明顯進(jìn)步。例如在SWE-bench Verified基準(zhǔn)的編碼測試中,o1的評分從o1 preview的41.3提高到48.9,而以數(shù)學(xué)為重點的AIME測試中的評分甚至從42躍升至79.2。

O1的新功能為開發(fā)者提供更多幫助。比如結(jié)構(gòu)性輸出Structured Outputs功能讓響應(yīng)可靠地匹配自定義格式,如JSON模式,從而確保與外部系統(tǒng)交互時的一致性;函數(shù)調(diào)用Function calling功能簡化了將o1連接到API和數(shù)據(jù)庫的過程;對視覺輸入進(jìn)行推理的能力Vison capabilities發(fā)掘了制造、科學(xué)和編碼方面用例的前景。

開發(fā)人員還可以使用新的reasoning_effort參數(shù)微調(diào)o1的行為,該參數(shù)控制模型在任務(wù)上花費的時間,以此平衡性能和響應(yīng)時間。

同時,o1的延遲更低,對于給定的請求,o1使用的推理token比o1-preview平均少60%。

本周二OpenAI還更新了支持語音助手、實時翻譯工具等低延遲自然對話體驗的Realtime API。OpenAI同時降低Realtime API的收費,將GPT-4o音頻的定價降低了60%,降至每100萬個輸入token收費40美元,每100萬個輸出token收費80美元。GPT-4o mini的文本token費率也大幅下調(diào),輸入token起步價0.60美元,輸出token起步價2.40美元。

英偉達(dá)推出僅249美元的AI超級電腦 生成式AI性能提高達(dá)1.7倍

另外值得注意的是,英偉達(dá)當(dāng)?shù)貢r間12月17日推出了一款名為Jetson Orin Nano Super的生成式AI超級計算機(jī)。英偉達(dá)CEO黃仁勛表示,這款開發(fā)者套件通過軟件升級實現(xiàn)了更高性能和更低價格,僅售249美元,尺寸小巧,可放在手掌中,可將生成式AI性能提高高達(dá)1.7倍。

該公司表示,這款產(chǎn)品適合商業(yè)AI開發(fā)者、愛好者和學(xué)生,與其前代產(chǎn)品相比,其生成式AI推理性能提升了1.7倍,性能提高了70%,每秒可以執(zhí)行高達(dá)67萬億次的INT8運算(67 INT8 TOPS),內(nèi)存帶寬也提升了50%,達(dá)到了102GB/s。

黃仁勛還特意為這款產(chǎn)品錄制了一段視頻,如同2021年發(fā)布Hopper H100時一樣,展現(xiàn)英偉達(dá)對這款產(chǎn)品的重視。在視頻中,黃仁勛表示,從Xavier開始,英偉達(dá)就創(chuàng)造了一種新的處理器,也就是機(jī)器人處理器,當(dāng)時沒人知道他們在做什么。

黃仁勛表示,Jetson Orin Nano Super非常適合那些希望在生成式AI、機(jī)器人技術(shù)或計算機(jī)視覺領(lǐng)域發(fā)展技能的人士。在AI領(lǐng)域從任務(wù)專用模型向基礎(chǔ)模型轉(zhuǎn)變的趨勢下,它也為開發(fā)者提供了一個將創(chuàng)意變?yōu)楝F(xiàn)實的易用平臺。

Jetson Orin Nano Super性能增強(qiáng),為所有流行的生成式AI模型,例如Meta的LLaMA、阿里巴巴的通義千問以及谷歌的Gemma。這款套件基于Transformer的計算機(jī)視覺模型帶來了顯著提升,進(jìn)一步提升效能表現(xiàn)。

英偉達(dá)強(qiáng)調(diào),隨著AI技術(shù)逐漸從云端走向終端,實體AI將是下一波發(fā)展重點,Jetson Orin Nano Super不僅可以用于開發(fā)聊天機(jī)器人,也適合簡歷視覺AI代理或部署AI機(jī)器人等應(yīng)用。

英偉達(dá)也宣布將為Jetson Orin NX和Nano系列的系統(tǒng)模塊提供軟件更新,讓它們也能享受到Super模式的性能提升,最高可達(dá)70%。這些更新將通過Jetpack SDK管理器發(fā)布在英偉達(dá)網(wǎng)站和GitHub上。

責(zé)任編輯: 胡青
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機(jī)會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達(dá)個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換