亚洲av乱码久久精品蜜桃,一区三区精品在线观看,欧美一级伦奷片在线播放

公眾號

電子報客戶端

OpenAI王炸新一波：向開發(fā)者開放滿血o1，測試中全面超越人類博士專家，準(zhǔn)確率達(dá)到78.3%

來源：每日經(jīng)濟(jì)新聞2024-12-18 07:39

在人工智能領(lǐng)域，英偉達(dá)再次引領(lǐng)技術(shù)革新，于當(dāng)?shù)貢r間12月17日推出了Jetson Orin Nano Super，一款手掌大小的生成式AI超級計算機(jī)。這款僅售249美元的開發(fā)者套件，以其卓越的性能和親民的價格，為商業(yè)AI開發(fā)者、愛好者和學(xué)生提供了一個強(qiáng)大的工具。英偉達(dá)CEO黃仁勛強(qiáng)調(diào)，Jetson Orin Nano Super的性能提升了70%，每秒可執(zhí)行高達(dá)67萬億次的INT8運算。

同時，OpenAI也不甘示弱，推出了最強(qiáng)推理模型o1，其在多個基準(zhǔn)測試中超越人類專家，預(yù)示著通用人工智能(AGI)的進(jìn)一步發(fā)展。

OpenAI王炸新一波：向開發(fā)者開放滿血o1，全面超越人類博士專家

在為期12個工作日的線上新品和新技術(shù)發(fā)布活動中，OpenAI的王炸又來了一波：將OpenAI的最強(qiáng)推理模型o1向開發(fā)者開放，用于開發(fā)語音類App的API中納入了收費更低的先進(jìn)模型GPT-4o版本。

今年9月，OpenAI 發(fā)布了o1的預(yù)覽版o1 preview，稱o1是第一個具備真正通用推理能力的大模型，它的核心能力推理在測試化學(xué)、物理和生物學(xué)專業(yè)知識的基準(zhǔn)GPQA-diamond上得到了充分體現(xiàn)。

據(jù)OpenAI的評估，o1在該測試中全面超過了人類博士專家，準(zhǔn)確率達(dá)到78.3%，而人類專家的得分為69.7%。OpenAI稱，“通用人工智能(AGI)之路，已經(jīng)沒有任何阻礙”。此外，o1在多個高難度的推理基準(zhǔn)測試中表現(xiàn)優(yōu)異，例如在美國數(shù)學(xué)邀請賽（AIME）中，o1的正確率達(dá)到了83.3%，遠(yuǎn)超其前身GPT-4o的表現(xiàn)。

12月5日，OpenAI在預(yù)告的連續(xù)12日王炸發(fā)布活動首日就推出了正式版的o1，所謂滿血o1，它被納入ChatGPT Plus套餐。正式版o1支持多模態(tài)輸入，具備視覺推理能力。相比o1 preview版本，正式版o1的平均響應(yīng)速度快了60%，OpenAI還發(fā)現(xiàn)正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。

在包括編碼、數(shù)學(xué)和視覺推理任務(wù)在內(nèi)的一系列基準(zhǔn)測試中，正式版o1都相比預(yù)覽版取得了明顯進(jìn)步。例如在SWE-bench Verified基準(zhǔn)的編碼測試中，o1的評分從o1 preview的41.3提高到48.9，而以數(shù)學(xué)為重點的AIME測試中的評分甚至從42躍升至79.2。

O1的新功能為開發(fā)者提供更多幫助。比如結(jié)構(gòu)性輸出Structured Outputs功能讓響應(yīng)可靠地匹配自定義格式，如JSON模式，從而確保與外部系統(tǒng)交互時的一致性；函數(shù)調(diào)用Function calling功能簡化了將o1連接到API和數(shù)據(jù)庫的過程；對視覺輸入進(jìn)行推理的能力Vison capabilities發(fā)掘了制造、科學(xué)和編碼方面用例的前景。

開發(fā)人員還可以使用新的reasoning_effort參數(shù)微調(diào)o1的行為，該參數(shù)控制模型在任務(wù)上花費的時間，以此平衡性能和響應(yīng)時間。

同時，o1的延遲更低，對于給定的請求，o1使用的推理token比o1-preview平均少60%。

本周二OpenAI還更新了支持語音助手、實時翻譯工具等低延遲自然對話體驗的Realtime API。OpenAI同時降低Realtime API的收費，將GPT-4o音頻的定價降低了60%，降至每100萬個輸入token收費40美元，每100萬個輸出token收費80美元。GPT-4o mini的文本token費率也大幅下調(diào)，輸入token起步價0.60美元，輸出token起步價2.40美元。

英偉達(dá)推出僅249美元的AI超級電腦生成式AI性能提高達(dá)1.7倍

另外值得注意的是，英偉達(dá)當(dāng)?shù)貢r間12月17日推出了一款名為Jetson Orin Nano Super的生成式AI超級計算機(jī)。英偉達(dá)CEO黃仁勛表示，這款開發(fā)者套件通過軟件升級實現(xiàn)了更高性能和更低價格，僅售249美元，尺寸小巧，可放在手掌中，可將生成式AI性能提高高達(dá)1.7倍。

該公司表示，這款產(chǎn)品適合商業(yè)AI開發(fā)者、愛好者和學(xué)生，與其前代產(chǎn)品相比，其生成式AI推理性能提升了1.7倍，性能提高了70%，每秒可以執(zhí)行高達(dá)67萬億次的INT8運算（67 INT8 TOPS），內(nèi)存帶寬也提升了50%，達(dá)到了102GB/s。

黃仁勛還特意為這款產(chǎn)品錄制了一段視頻，如同2021年發(fā)布Hopper H100時一樣，展現(xiàn)英偉達(dá)對這款產(chǎn)品的重視。在視頻中，黃仁勛表示，從Xavier開始，英偉達(dá)就創(chuàng)造了一種新的處理器，也就是機(jī)器人處理器，當(dāng)時沒人知道他們在做什么。

黃仁勛表示，Jetson Orin Nano Super非常適合那些希望在生成式AI、機(jī)器人技術(shù)或計算機(jī)視覺領(lǐng)域發(fā)展技能的人士。在AI領(lǐng)域從任務(wù)專用模型向基礎(chǔ)模型轉(zhuǎn)變的趨勢下，它也為開發(fā)者提供了一個將創(chuàng)意變?yōu)楝F(xiàn)實的易用平臺。

Jetson Orin Nano Super性能增強(qiáng)，為所有流行的生成式AI模型，例如Meta的LLaMA、阿里巴巴的通義千問以及谷歌的Gemma。這款套件基于Transformer的計算機(jī)視覺模型帶來了顯著提升，進(jìn)一步提升效能表現(xiàn)。