在人工智能領(lǐng)域,英偉達(dá)再次引領(lǐng)技術(shù)革新,于當(dāng)?shù)貢r間12月17日推出了Jetson Orin Nano Super,一款手掌大小的生成式AI超級計算機(jī)。這款僅售249美元的開發(fā)者套件,以其卓越的性能和親民的價格,為商業(yè)AI開發(fā)者、愛好者和學(xué)生提供了一個強(qiáng)大的工具。英偉達(dá)CEO黃仁勛強(qiáng)調(diào),Jetson Orin Nano Super的性能提升了70%,每秒可執(zhí)行高達(dá)67萬億次的INT8運算。
同時,OpenAI也不甘示弱,推出了最強(qiáng)推理模型o1,其在多個基準(zhǔn)測試中超越人類專家,預(yù)示著通用人工智能(AGI)的進(jìn)一步發(fā)展。
在為期12個工作日的線上新品和新技術(shù)發(fā)布活動中,OpenAI的王炸又來了一波:將OpenAI的最強(qiáng)推理模型o1向開發(fā)者開放,用于開發(fā)語音類App的API中納入了收費更低的先進(jìn)模型GPT-4o版本。
今年9月,OpenAI 發(fā)布了o1的預(yù)覽版o1 preview,稱o1是第一個具備真正通用推理能力的大模型,它的核心能力推理在測試化學(xué)、物理和生物學(xué)專業(yè)知識的基準(zhǔn)GPQA-diamond上得到了充分體現(xiàn)。
據(jù)OpenAI的評估,o1在該測試中全面超過了人類博士專家,準(zhǔn)確率達(dá)到78.3%,而人類專家的得分為69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經(jīng)沒有任何阻礙”。此外,o1在多個高難度的推理基準(zhǔn)測試中表現(xiàn)優(yōu)異,例如在美國數(shù)學(xué)邀請賽(AIME)中,o1的正確率達(dá)到了83.3%,遠(yuǎn)超其前身GPT-4o的表現(xiàn)。
12月5日,OpenAI在預(yù)告的連續(xù)12日王炸發(fā)布活動首日就推出了正式版的o1,所謂滿血o1,它被納入ChatGPT Plus套餐。正式版o1支持多模態(tài)輸入,具備視覺推理能力。相比o1 preview版本,正式版o1的平均響應(yīng)速度快了60%,OpenAI還發(fā)現(xiàn)正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。
在包括編碼、數(shù)學(xué)和視覺推理任務(wù)在內(nèi)的一系列基準(zhǔn)測試中,正式版o1都相比預(yù)覽版取得了明顯進(jìn)步。例如在SWE-bench Verified基準(zhǔn)的編碼測試中,o1的評分從o1 preview的41.3提高到48.9,而以數(shù)學(xué)為重點的AIME測試中的評分甚至從42躍升至79.2。
O1的新功能為開發(fā)者提供更多幫助。比如結(jié)構(gòu)性輸出Structured Outputs功能讓響應(yīng)可靠地匹配自定義格式,如JSON模式,從而確保與外部系統(tǒng)交互時的一致性;函數(shù)調(diào)用Function calling功能簡化了將o1連接到API和數(shù)據(jù)庫的過程;對視覺輸入進(jìn)行推理的能力Vison capabilities發(fā)掘了制造、科學(xué)和編碼方面用例的前景。
開發(fā)人員還可以使用新的reasoning_effort參數(shù)微調(diào)o1的行為,該參數(shù)控制模型在任務(wù)上花費的時間,以此平衡性能和響應(yīng)時間。
同時,o1的延遲更低,對于給定的請求,o1使用的推理token比o1-preview平均少60%。
本周二OpenAI還更新了支持語音助手、實時翻譯工具等低延遲自然對話體驗的Realtime API。OpenAI同時降低Realtime API的收費,將GPT-4o音頻的定價降低了60%,降至每100萬個輸入token收費40美元,每100萬個輸出token收費80美元。GPT-4o mini的文本token費率也大幅下調(diào),輸入token起步價0.60美元,輸出token起步價2.40美元。
另外值得注意的是,英偉達(dá)當(dāng)?shù)貢r間12月17日推出了一款名為Jetson Orin Nano Super的生成式AI超級計算機(jī)。英偉達(dá)CEO黃仁勛表示,這款開發(fā)者套件通過軟件升級實現(xiàn)了更高性能和更低價格,僅售249美元,尺寸小巧,可放在手掌中,可將生成式AI性能提高高達(dá)1.7倍。
該公司表示,這款產(chǎn)品適合商業(yè)AI開發(fā)者、愛好者和學(xué)生,與其前代產(chǎn)品相比,其生成式AI推理性能提升了1.7倍,性能提高了70%,每秒可以執(zhí)行高達(dá)67萬億次的INT8運算(67 INT8 TOPS),內(nèi)存帶寬也提升了50%,達(dá)到了102GB/s。
黃仁勛還特意為這款產(chǎn)品錄制了一段視頻,如同2021年發(fā)布Hopper H100時一樣,展現(xiàn)英偉達(dá)對這款產(chǎn)品的重視。在視頻中,黃仁勛表示,從Xavier開始,英偉達(dá)就創(chuàng)造了一種新的處理器,也就是機(jī)器人處理器,當(dāng)時沒人知道他們在做什么。
黃仁勛表示,Jetson Orin Nano Super非常適合那些希望在生成式AI、機(jī)器人技術(shù)或計算機(jī)視覺領(lǐng)域發(fā)展技能的人士。在AI領(lǐng)域從任務(wù)專用模型向基礎(chǔ)模型轉(zhuǎn)變的趨勢下,它也為開發(fā)者提供了一個將創(chuàng)意變?yōu)楝F(xiàn)實的易用平臺。
Jetson Orin Nano Super性能增強(qiáng),為所有流行的生成式AI模型,例如Meta的LLaMA、阿里巴巴的通義千問以及谷歌的Gemma。這款套件基于Transformer的計算機(jī)視覺模型帶來了顯著提升,進(jìn)一步提升效能表現(xiàn)。
英偉達(dá)強(qiáng)調(diào),隨著AI技術(shù)逐漸從云端走向終端,實體AI將是下一波發(fā)展重點,Jetson Orin Nano Super不僅可以用于開發(fā)聊天機(jī)器人,也適合簡歷視覺AI代理或部署AI機(jī)器人等應(yīng)用。
英偉達(dá)也宣布將為Jetson Orin NX和Nano系列的系統(tǒng)模塊提供軟件更新,讓它們也能享受到Super模式的性能提升,最高可達(dá)70%。這些更新將通過Jetpack SDK管理器發(fā)布在英偉達(dá)網(wǎng)站和GitHub上。