太平洋科技要聞

首頁 > 科技要聞 > 科技> 正文

性能超越 GPT-4 Turbo！「商湯日日新」大升級(jí)，國產(chǎn)大模型超市開張了

appso 整合編輯：龔震發(fā)布于：2024-04-24 16:39

在大模型的浪潮席卷而來的前幾年，其實(shí)也掀起過一陣 AI 創(chuàng)業(yè)熱潮。其中商湯科技、曠視科技、云從科技、依圖科技是這個(gè)時(shí)期的代表，這四家公司也被稱為「中國 AI 四小龍」。

到了 OpenAI 掀起的這股新浪潮中，四小龍中的商湯科技還留在舞臺(tái)中央。去年 4 月商湯發(fā)布「日日新·大模型」系列，是國內(nèi)最早推出基于千億參數(shù)大語言模型的公司之一。

茍日新，日日新，又日新。

商朝的開國君主湯在澡盆上刻了上述自我告誡的格言，恰似今天 AIGC 領(lǐng)域的變化速度，商湯大模型更新的節(jié)奏也可謂「日日新」。

兩個(gè)月前，商湯推出「日日新 SenseNova 4.0」大模型體系，甚至先 OpenAI 一步首發(fā)了全球首個(gè)支持不同模態(tài)工具調(diào)用的 Assistants API。

而今天下午，「又日新」的商湯繼續(xù)推出了一系列基于「日日新」的生成式 AI 模型及應(yīng)用，先給大家劃重點(diǎn)：

-日日新 5.0：常用客觀評(píng)測(cè)上達(dá)到或超越了 GPT-4 Turbo

-1.8B 的端側(cè)模型：同等尺度性能最優(yōu)，跨級(jí)尺度全面領(lǐng)先

-企業(yè)級(jí)的應(yīng)用一體機(jī)：涉及金融、醫(yī)療、政務(wù)、代碼等領(lǐng)域

-尚未上線的文生視頻生成平臺(tái)

拳打 GPT-4 Turbo ，腳踢 DALL·E 3

AI 2.0 時(shí)代，生成式 AI 被視為推動(dòng)生產(chǎn)力進(jìn)步的重要技術(shù)，如果能在知識(shí)、推理、執(zhí)行三層能力上實(shí)現(xiàn)突破，將真正帶來整個(gè)社會(huì)生產(chǎn)力的跨越式發(fā)展。

上個(gè)月，商湯 CEO 徐立在出席 2024 GDC 提出了如上觀點(diǎn)，而在今天的發(fā)布會(huì)上，他再次強(qiáng)調(diào)，商湯在尺度定律的指導(dǎo)下，會(huì)持續(xù)探索大模型能力的 KRE 三層架構(gòu)（知識(shí)-推理-執(zhí)行），不斷突破大模型能力邊界。

那么全新升級(jí)的日日新 SenseNova 5.0（以下簡(jiǎn)稱：日日新 5.0）又有哪些更新亮點(diǎn)呢？

-采用 MoE 架構(gòu)

-基于 10TB tokens 訓(xùn)練，大量合成數(shù)據(jù)

-推理上下文窗口支持 200K

-知識(shí)、推理、數(shù)學(xué)、代碼全面對(duì)標(biāo) GPT-4 Turbo

日日新 5.0 本次更新主要增強(qiáng)了知識(shí)、數(shù)學(xué)、推理及代碼能力，全面對(duì)標(biāo) GPT-4 Turbo。

在主流客觀評(píng)測(cè)上，日日新 5.0 達(dá)到或超越了去年 OpenAI 在開發(fā)者大會(huì)上發(fā)布的 GPT-4 Turbo 版本，同時(shí)也幾乎碾壓了近期發(fā)布的 Llama 3-70B。

光說不練假把式，在發(fā)布會(huì)現(xiàn)場(chǎng)，商湯全方位展示了日日新 5.0 在語言、數(shù)學(xué)推理等方面的實(shí)際能力。

同樣輸入一道 2022 年的高考作文題，對(duì)比 GPT-4 Turbo(僅為去年 11 月份的版本，下同)可以看到，日日新 5.0 生成的結(jié)果脫離了模版套路化的束縛，多了點(diǎn)人味，一看就是能走進(jìn)高考閱卷老師心坎的文章。

面對(duì)數(shù)學(xué)問題的拷問，GPT-4 Turbo 開始有些招架不住，不僅計(jì)算過程復(fù)雜，最終得出的結(jié)果也是錯(cuò)誤的，而日日新 5.0 這邊得出的答案則充滿條理性，也完全正確。

行業(yè)差異化是大模型競(jìng)爭(zhēng)中脫穎而出的關(guān)鍵因素。

瞄準(zhǔn)本土化應(yīng)用場(chǎng)景的日日新 5.0，在理解中文特有的文化和語境上是要優(yōu)于 GPT-4 Turbo 的。GPT-4 Turbo 既然不熟悉中文語境，自然也就無法準(zhǔn)確把握「老鷹捉小雞」這樣的本土游戲規(guī)則。

多模態(tài)能力被業(yè)界普遍視為實(shí)現(xiàn) AGI 的關(guān)鍵路徑。

從基準(zhǔn)測(cè)試結(jié)果上看，日日新 5.0 也能與 GPT-4V 打得火熱，并且互有勝負(fù)。在實(shí)際的案例演示中，日日新 5.0 支持的秒畫生成老象的效果更自然一些，而同樣的問題給到友商，甚至還會(huì)出現(xiàn)三條腿的謬誤。

基于同一 Prompt 生成的人像圖，商湯旗下秒畫生成的皮膚紋理自然，既沒有過度磨皮加濾鏡，也順利完成了「美麗」的指標(biāo) �？紤]到國際上用于訓(xùn)練 AI 模型的亞洲人像數(shù)據(jù)庫相對(duì)有限，這樣的對(duì)比結(jié)果也相對(duì)正常。

結(jié)合多模態(tài)和數(shù)據(jù)分析能力，AI 能夠?qū)崿F(xiàn)更為復(fù)雜和高級(jí)的任務(wù)。

日日新 5.0 上能「攻破」長(zhǎng)圖的總結(jié)描述，中能識(shí)別滴滴打車的具體信息，下還能計(jì)算中國特有早餐的熱量，同樣的問題給到 GPT-4 Turbo，也許就是兩眼一抹黑。

總說 AI 會(huì)重塑工作流，這一次，商湯也特別演示辦公小浣熊在這方面的能力。

將 F1 賽車手周冠宇三年的參賽記錄輸入到系統(tǒng)中，并讓它繪制出參與比賽數(shù)量的柱狀圖，這個(gè)任務(wù)看似簡(jiǎn)單，但實(shí)際上牽涉到復(fù)雜的識(shí)別難題。

在國際比賽中，周冠宇使用其英文名字參賽。傳統(tǒng)的大模型在處理這類涉及非英文常規(guī)拼寫或者特定人物的識(shí)別任務(wù)時(shí)，往往表現(xiàn)不佳。而日日新 5.0 升級(jí)的辦公小浣熊雖然經(jīng)歷了一些波折，但最終還是順利繪制出來。

端側(cè)大模型，唯快不破

在武俠世界中，「天下武功，唯快不破」強(qiáng)調(diào)了速度在實(shí)戰(zhàn)中的重要性，而在大模型的戰(zhàn)役中，這一原則同樣適用。

隨著大模型技術(shù)的快速發(fā)展，不同應(yīng)用場(chǎng)景的需求日益顯現(xiàn)，智能手機(jī)、電腦、VR 眼鏡等終端設(shè)備對(duì)大模型的使用頻率，性能速度，安全穩(wěn)定等提出了更高要求。

變得更務(wù)實(shí)的商湯在本次發(fā)布會(huì)也正式推出了 1.8B 的 SenseChat-Lite 版本端側(cè)⼤模型。

在基準(zhǔn)測(cè)試中，該端側(cè)模型全面超越了 MiniCPM-2B、Phi-2 等同量級(jí)的大模型，并且還越級(jí)比肩一些 7B、13B 大模型，用徐立的話來說，那就是同等尺度性能最優(yōu)，跨級(jí)尺度全面領(lǐng)先。

研究表明，人眼最快的閱讀速度大概就是 20 字/秒，而搭載 1.8B 商湯端側(cè)模型在中端手機(jī)上能夠?qū)崿F(xiàn) 18.3 字/秒的速度，而在旗艦手機(jī)則最高支持 78.3 字/秒，成為業(yè)內(nèi)最快推理速度。

商湯還推出端云協(xié)同解決方案，可以通過智能化判斷協(xié)同發(fā)揮端云各自優(yōu)勢(shì)，需要聯(lián)網(wǎng)搜索或處理復(fù)雜場(chǎng)景時(shí)分流至云端處理，部分場(chǎng)景端側(cè)處理占比超過 80%，從而顯著降低推理成本。

在與「商量」的寥寥幾秒對(duì)談中，無論是幾秒生成請(qǐng)假報(bào)告，還是總結(jié)幾千字的文檔都能快速響應(yīng)。

端側(cè)擴(kuò)散模型還能實(shí)現(xiàn)業(yè)內(nèi)最快推理速度，端側(cè) LDM-AI 擴(kuò)圖技術(shù)在某主流平臺(tái)上，推理速度小于 1.5 秒，比友商云端 app 快10倍，支持輸出 1200 萬像素及以上的高清圖片，支持在端上快速進(jìn)行等比擴(kuò)圖、自由擴(kuò)圖、旋轉(zhuǎn)擴(kuò)圖等圖像編輯功能。

現(xiàn)場(chǎng)的演示中，工作人員更是可以做到隨拍隨擴(kuò)，將端側(cè)大模型「唯快不破」的能力展現(xiàn)得淋漓盡致。

并且，據(jù)徐立介紹，該端側(cè)大模型主要適用于日常對(duì)話、常識(shí)問答、文案生成、相冊(cè)管理、圖片生成、圖片擴(kuò)展等六大領(lǐng)域，還支持多設(shè)備適配，使其能夠靈活地應(yīng)用于各種不同的場(chǎng)景和設(shè)備之中。

對(duì)于金融、代碼、醫(yī)療、政務(wù)等重點(diǎn)行業(yè)邊緣側(cè)日益增長(zhǎng)的 AI 應(yīng)用需求，商湯還正式推出了高性價(jià)比、開箱即用、數(shù)據(jù)安全、全國產(chǎn)化的企業(yè)級(jí)應(yīng)用一體機(jī)，涉及金融、醫(yī)療、政務(wù)、代碼等四大行業(yè)。

以政務(wù)智能咨詢問答平臺(tái)為例，它不僅能夠理解用戶提出的問題，還能提供答案的參考來源，極大地提升政務(wù)服務(wù)的智能化水平。

徐立指出，自然語言仍然不能替代編程語言，當(dāng)前的「AI 程序員」無法獨(dú)立完成復(fù)雜的工業(yè)級(jí)代碼項(xiàng)目，而 Copilot 才是更適合的形態(tài)。

因此，今天商湯還發(fā)布了小浣熊·代碼大模型一體機(jī)輕量版，單臺(tái)支持 100 人規(guī)模研發(fā)團(tuán)隊(duì)使用。支持?jǐn)?shù)據(jù)不出域，安全有保障，免費(fèi)部署即可開箱即用。每臺(tái)售價(jià) 35 萬元起，為中小企業(yè)用戶提供了高性價(jià)比的選擇。

今年以來，Sora 的出現(xiàn)讓人們見識(shí)到了 AI 視頻生成的無限創(chuàng)造潛力，徐立在最后環(huán)節(jié)也帶來了「One more thing」——三段完全由大模型生成的視頻。尚未上線的文生視頻生成平臺(tái)也在人物可控性、動(dòng)作可控性以及場(chǎng)景可控性等方面都有著出色的表現(xiàn)。

AI 應(yīng)用落地需要一個(gè)即插即用的大模型超市

在 GPT-4 發(fā)布一年后，大模型們依然在不斷卷參數(shù)刷榜。但今年行業(yè)里大家真正關(guān)心的，其實(shí)是怎么將大模型通過 Agent，并接入到無數(shù)企業(yè)和個(gè)人的工作流中。

OpenAI 的 GPT Store 沒有如愿成為 AI 行業(yè)的 GPT Store，但大量的需求和問題依然擺在那。大模型的強(qiáng)大的能力和落地不同行業(yè)場(chǎng)景之間缺乏暢通的橋梁，同時(shí)也意味著一個(gè)巨大的機(jī)遇。

商湯的日日新開放平臺(tái)，實(shí)際上就是一個(gè)大模型超市。通過多模態(tài)的模型能力提升 API 的調(diào)用效率，降低企業(yè)和開發(fā)者調(diào)用和定制各種 AI 功能的門檻。

比起模型的規(guī)模參數(shù)，商湯更側(cè)重于模型的能力應(yīng)用。從商湯針對(duì)金融、醫(yī)療、政務(wù)、代碼的行業(yè)大模型，到目前行業(yè)推理速度最快的端側(cè)模型，以及商量、如影、大醫(yī)、小浣熊家族等 AI 原生應(yīng)用，都可能看出商湯想要提供接口更豐富，能執(zhí)行不同行業(yè)復(fù)雜任務(wù)的 AI 工具箱。

知名調(diào)研機(jī)構(gòu) Frost & Sullivan 發(fā)布的《2023年中國AI開發(fā)平臺(tái)市場(chǎng)報(bào)告》指出，SenseCore 商湯大裝置已成為中國 AI 開發(fā)平臺(tái)云計(jì)算基礎(chǔ)設(shè)施供應(yīng)商的領(lǐng)先者。在硬件基礎(chǔ)設(shè)施兼容性、產(chǎn)業(yè)鏈合作情況、模型訓(xùn)練優(yōu)化模塊、智能標(biāo)注技術(shù)能力、預(yù)訓(xùn)練模型技術(shù)水平5個(gè)評(píng)估項(xiàng)目中，商湯均獲得最高分。

我們前段時(shí)間報(bào)道過金山辦公的 WPS AI 企業(yè)版，其中合作的大模型就有商湯。金山表示商湯在數(shù)據(jù)分析上比較出色，因此 WPS AI 就調(diào)用它處需要理科思維的場(chǎng)景。

APPSO 把金山這種不生產(chǎn)大模型，而是堅(jiān)定做大模型應(yīng)用的公司，稱為 AI 的應(yīng)用主義者。而商湯在其中扮演的角色，與其說是大模型的提供商，不如說是幫助各行各業(yè)大規(guī)模應(yīng)用落地 AI 應(yīng)用的百貨超市。

什么是百貨超市？有著廣泛的產(chǎn)品線，能滿足不同消費(fèi)者大大小小的個(gè)性化需求。最重要的是，百貨超市的出現(xiàn)讓種類繁多的商品更容易被大眾獲取，讓更多普通人便捷享受到全世界的優(yōu)質(zhì)產(chǎn)品和體驗(yàn)。

而這，正是方興未艾的 AIGC 未來對(duì)我們最大的價(jià)值。而公司作為現(xiàn)代社會(huì)最偉大的發(fā)明之一，如果說大模型正在帶來第四次工業(yè)革命，大概率是從對(duì)企業(yè)的影響開始。已故的商湯創(chuàng)始人湯曉鷗也曾表示：

并不存在 AI 這個(gè)行業(yè)，只有 AI+行業(yè)，強(qiáng)調(diào) AI 需要與傳統(tǒng)產(chǎn)業(yè)合作，這種關(guān)系是結(jié)合與賦能，而不是顛覆，其價(jià)值在于幫助傳統(tǒng)產(chǎn)業(yè)提高生產(chǎn)效率，解放生產(chǎn)力。

湯曉鷗在一次演講中提到，「企業(yè)融資不是用來燒的，而是做偉大的事�！苟虦萍嘉磥硎暌龅摹�?jìng)ゴ蟮氖隆�，將是幫助千行百業(yè)將 AIGC 落地。

文章來源：APPSO

大模型商湯科技 AI應(yīng)用

appso

原創(chuàng)欄目