OpenAI勁敵Anthropic發(fā)布“最智能”AI模型!
來源:證券時報網(wǎng)作者:周春媚2025-02-25 18:18

2月25日,OpenAI的最強(qiáng)勁敵、美國AI大模型初創(chuàng)公司Anthropic發(fā)布了首個混合推理模型Claude 3.7 Sonnet。與其他模型相比,Claude 3.7 Sonnet最特別之處在于集合了大語言模型和推理模型于一身,用戶可以選擇讓模型實時快速作答,也可以選擇讓其進(jìn)行更深入的思考。

在發(fā)布新模型的同時,據(jù)華爾街日報日前報道,Anthropic正在洽談一輪35億美元的融資,這一規(guī)模遠(yuǎn)遠(yuǎn)超出最初計劃融資20億美元的預(yù)期。據(jù)了解,投資者對Anthropic表達(dá)了高漲的興趣,在談判過程中提高了融資規(guī)模。若新一輪融資完成,Anthropic最新的估值將達(dá)到615億美元,是此前180億美元估值的近4倍。

發(fā)布市場上唯一的“混合”模型

Anthropic認(rèn)為,就像人類不會有兩個不同的大腦來分別處理可以立即回答的問題和需要思考的問題一樣,推理只是前沿模型應(yīng)具備的能力之一,應(yīng)與其他能力順暢融合,而不是一個完全獨立的模型。

因此,Claude 3.7 Sonnet將最先進(jìn)的大型語言模型的功能與推理模型的功能相結(jié)合。雖然大語言模型通常生成文本并理解語言模式,但推理模型是一種特定類型的大語言模型,可以將復(fù)雜問題分解為幾個步驟,顯示其得出解決方案的“思路鏈”。Claude 3.7 Sonnet兼具“推理模式”與“傳統(tǒng)模式”,既可以思考復(fù)雜問題,也可以實時生成答案。

值得注意的是,這是市場上唯一的“混合”模型,也被Anthropic稱為迄今為止“最智能”的人工智能模型。具體而言,Claude 3.7 Sonnet將提供兩種思考模式——“標(biāo)準(zhǔn)”和“擴(kuò)展”。用戶可以選擇希望采用哪種思考模式?!皹?biāo)準(zhǔn)思考”是無需進(jìn)行復(fù)雜的推理過程,就能立刻提供答案;“擴(kuò)展思維”則需提供復(fù)雜的推理過程,會展示詳細(xì)的推理思維鏈。

在標(biāo)準(zhǔn)模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升級版。在擴(kuò)展思考模式下,它會在回答前進(jìn)行自我反思,從而提高了它在數(shù)學(xué)、物理、指令執(zhí)行、編碼以及許多其他任務(wù)上的表現(xiàn)。

除此以外,Claude 3.7 Sonnet具有卓越的編碼能力。測試數(shù)據(jù)顯示,Claude 3.7 Sonnet在編寫代碼能力方面大幅度超過了DeepSeek-R1、OpenAI的o1、o3模型等。Anthropic還推出了代理編碼工具Claude Code,可以搜索和讀取代碼、編輯文件、編寫和運行測試、提交和推送代碼到GitHub以及使用命令行工具。

新一輪融資規(guī)模遠(yuǎn)超預(yù)期

在DeepSeek讓開源逐漸深入人心的同時,以O(shè)penAI、Anthropic等為代表的閉源模型社區(qū)也不甘落后。值得注意的是,在OpenAI對于走閉源路線已不那么篤定的背景下,Anthropic正逐漸變成閉源社區(qū)中的“扛大旗者”。

在今年春節(jié)DeepSeek引發(fā)海外廣泛關(guān)注期間,Anthropic的聯(lián)合創(chuàng)始人Dario Amodei還發(fā)表了一篇長文,系統(tǒng)闡述對于DeepSeek的看法。他表示,DeepSeek的訓(xùn)練成本遠(yuǎn)沒有人們說的那么低,“600萬美元模型”的說法忽略了許多關(guān)鍵背景。更準(zhǔn)確的說法應(yīng)該是DeepSeek以更低的成本生成出一個接近7—10個月前美國模型水平的產(chǎn)品。言外之意是,閉源模型仍然處于領(lǐng)先的位置。

他還同時表示,大模型還處在擴(kuò)展曲線的早期階段,只要有一個強(qiáng)大的預(yù)訓(xùn)練模型作為基礎(chǔ),幾家公司都能開發(fā)出這類模型?!拔覀冋幵谝粋€有趣的‘交叉點’,暫時出現(xiàn)了多家公司都能生產(chǎn)出優(yōu)秀推理模型的情況。但隨著各公司在這些模型上繼續(xù)向上攀升擴(kuò)展曲線,這種情況很快就會消失?!盌ario Amodei表示。

事實上,當(dāng)DeepSeek橫空出世后,外界普遍認(rèn)為這將對Anthropic構(gòu)成直接的沖擊,因為如果閉源模型不能夠證明自己大幅領(lǐng)先于開源模型,那么支撐其繼續(xù)走閉源路線的基礎(chǔ)便不復(fù)存在。Anthropic今日發(fā)布新模型,無疑也是在“秀肌肉”,向外界展現(xiàn)其在技術(shù)方面的領(lǐng)先性。

在新模型推出之際,據(jù)外媒報道,Anthropic即將完成一輪35億美元融資,估值達(dá)615億美元,是此前180億美元估值的近4倍。本輪融資的投資者包括風(fēng)險投資公司Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners。此外,總部位于阿布扎比的MGX投資公司也在與Anthropic商談參與投資事宜。

35億美元的融資規(guī)模,已大幅超越其最初的20億美元融資計劃。這從側(cè)面表明盡管DeepSeek的崛起帶來了沖擊,但投資者仍對Anthropic這樣的閉源模型公司抱有信心。

校對:王朝全

責(zé)任編輯: 高蕊琦
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機(jī)會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達(dá)個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換