上海鋼聯(lián)日前在接受機構(gòu)調(diào)研時表示,公司計劃在一季度借助DeepSeek-R1快速蒸餾出全新的“宗師”行業(yè)大模型,并將其切換為“小鋼”數(shù)字智能助手的基座模型。據(jù)介紹,完成上述工作后,公司會跟現(xiàn)有“小鋼”進行比較,根據(jù)測試情況,會在二季度正式開放給用戶體驗。
“小鋼”數(shù)字智能助手是上海鋼聯(lián)基于大語言模型及AIGC技術(shù)的前沿探索成果,去年8月,“小鋼”正式上線。通過與智能助手交互對話的方式,“小鋼”能為客戶提供查價格、讀資訊、寫報告、問百科、找商機等內(nèi)容服務(wù),此外還具備了市場分析、多模態(tài)生成和智能客服等功能,并輔助文章閱讀,為用戶提供AI摘要。
不久前,上海鋼聯(lián)宣布,“小鋼”數(shù)字智能助手1.6版本對話使用的次數(shù)已經(jīng)超30000次、使用用戶數(shù)5000余人,生成的內(nèi)容每天都服務(wù)在大宗商品行業(yè)各個領(lǐng)域。值得說明的是,“小鋼”數(shù)字智能助手1.6版本依賴于“鋼聯(lián)宗師”大語言模型的支撐,進一步拓展了大語言模型的功能應(yīng)用。同時,在大模型語料方面,上海鋼聯(lián)打造“大模型數(shù)據(jù)標注平臺”,為模型的預(yù)訓(xùn)練、垂類能力的形成,提供了基礎(chǔ)數(shù)據(jù)保障。
具體而言,2024年,“鋼聯(lián)宗師”大語言模型成功完成鋼聯(lián)Agent底層架構(gòu)設(shè)計,并同時打造了8個Agent智能體。在大模型語料方面,上海鋼聯(lián)打造“大模型數(shù)據(jù)標注平臺”,通過平臺標注了48.5萬條大宗商品行業(yè)標準知識語料,并基于用戶真實歷史檢索記錄,標注、審核、形成逾10萬條高質(zhì)量對話意圖語料,為模型的預(yù)訓(xùn)練、垂類能力的形成,提供了基礎(chǔ)數(shù)據(jù)保障。
“近期DeepSeek-R1開源推理模型的推出,我們認為這樣一款低成本、強推理能力的模型,對大宗商品語義理解的復(fù)雜性,能有更好的處理能力,已開始部署相關(guān)工作?!鄙虾d撀?lián)日前在接受機構(gòu)調(diào)研時表示,公司的內(nèi)部計劃是借助DeepSeek-R1 快速蒸餾出全新的“宗師”模型,并切換“小鋼”數(shù)字智能助手的基座模型,提高“小鋼”的推理能力,和用戶更好交互,更好地去做查詢、知識整理、報告生成等工作。第二步基于DeepSeek的改造完成后,會把“小鋼”的能力整合到EBC平臺中服務(wù)行業(yè)的大客戶。
據(jù)了解,上海鋼聯(lián)技術(shù)團隊已完成小鋼全面接入DeepSeek API,并完成對應(yīng)的測試評估,效果好的AI摘要功能已經(jīng)切到DeepSeek提供服務(wù),同時也已經(jīng)完成DeepSeek-R1 32B 模型私有化部署;當前正在基于鋼聯(lián)“宗師”過往訓(xùn)練中積累的高質(zhì)量語料進行訓(xùn)練和微調(diào)工作,預(yù)計2月底前完成DeepSeek版新“宗師”行業(yè)模型的研發(fā)工作。上海鋼聯(lián)同時強調(diào),未來也可能存在其他不確定因素,請投資者關(guān)注業(yè)務(wù)發(fā)展不及預(yù)期的風(fēng)險。
上海鋼聯(lián)表示,將深化在AI智能化上的布局,開啟新的探索路徑,借助行業(yè)數(shù)據(jù)治理能力、行業(yè)大模型特色語料的積累、大模型的應(yīng)用和落地等能力和經(jīng)驗,進一步拓展底層模型的應(yīng)用范圍,為用戶提供定制化大模型應(yīng)用,助力大宗商品行業(yè)的智能化發(fā)展。(厲平)
校對:冉燕青