首頁 > 科技要聞 > 科技> 正文

性能超越 GPT-4 Turbo!「商湯日日新」大升級(jí),國產(chǎn)大模型超市開張了

appso 整合編輯:龔震 發(fā)布于:2024-04-24 16:39

在大模型的浪潮席卷而來的前幾年,其實(shí)也掀起過一陣 AI 創(chuàng)業(yè)熱潮。其中商湯科技、曠視科技、云從科技、依圖科技是這個(gè)時(shí)期的代表,這四家公司也被稱為「中國 AI 四小龍」。

到了 OpenAI 掀起的這股新浪潮中,四小龍中的商湯科技還留在舞臺(tái)中央。去年 4 月商湯發(fā)布「日日新·大模型」 系列,是國內(nèi)最早推出基于千億參數(shù)大語言模型的公司之一。

茍日新,日日新,又日新。

商朝的開國君主湯在澡盆上刻了上述自我告誡的格言,恰似今天 AIGC 領(lǐng)域的變化速度,商湯大模型更新的節(jié)奏也可謂「日日新」。

兩個(gè)月前,商湯推出「日日新 SenseNova 4.0」大模型體系,甚至先 OpenAI 一步首發(fā)了全球首個(gè)支持不同模態(tài)工具調(diào)用的 Assistants API。

而今天下午,「又日新」的商湯繼續(xù)推出了一系列基于「日日新」的生成式 AI 模型及應(yīng)用,先給大家劃重點(diǎn):

-日日新 5.0:常用客觀評(píng)測(cè)上達(dá)到或超越了 GPT-4 Turbo

-1.8B 的端側(cè)模型:同等尺度性能最優(yōu),跨級(jí)尺度全面領(lǐng)先

-企業(yè)級(jí)的應(yīng)用一體機(jī):涉及金融、醫(yī)療、政務(wù)、代碼等領(lǐng)域

-尚未上線的文生視頻生成平臺(tái)

拳打 GPT-4 Turbo ,腳踢 DALL·E 3

AI 2.0 時(shí)代,生成式 AI 被視為推動(dòng)生產(chǎn)力進(jìn)步的重要技術(shù),如果能在知識(shí)、推理、執(zhí)行三層能力上實(shí)現(xiàn)突破,將真正帶來整個(gè)社會(huì)生產(chǎn)力的跨越式發(fā)展。

上個(gè)月,商湯 CEO 徐立在出席 2024 GDC 提出了如上觀點(diǎn),而在今天的發(fā)布會(huì)上,他再次強(qiáng)調(diào),商湯在尺度定律的指導(dǎo)下,會(huì)持續(xù)探索大模型能力的 KRE 三層架構(gòu)(知識(shí)-推理-執(zhí)行),不斷突破大模型能力邊界。

那么全新升級(jí)的日日新 SenseNova 5.0(以下簡(jiǎn)稱:日日新 5.0)又有哪些更新亮點(diǎn)呢?

-采用 MoE 架構(gòu)

-基于 10TB tokens 訓(xùn)練,大量合成數(shù)據(jù)

-推理上下文窗口支持 200K

-知識(shí)、推理、數(shù)學(xué)、代碼全面對(duì)標(biāo) GPT-4 Turbo

日日新 5.0 本次更新主要增強(qiáng)了知識(shí)、數(shù)學(xué)、推理及代碼能力,全面對(duì)標(biāo) GPT-4 Turbo。

在主流客觀評(píng)測(cè)上,日日新 5.0 達(dá)到或超越了去年 OpenAI 在開發(fā)者大會(huì)上發(fā)布的 GPT-4 Turbo 版本,同時(shí)也幾乎碾壓了近期發(fā)布的 Llama 3-70B。

光說不練假把式,在發(fā)布會(huì)現(xiàn)場(chǎng),商湯全方位展示了日日新 5.0 在語言、數(shù)學(xué)推理等方面的實(shí)際能力。

同樣輸入一道 2022 年的高考作文題,對(duì)比 GPT-4 Turbo(僅為去年 11 月份的版本,下同)可以看到,日日新 5.0 生成的結(jié)果脫離了模版套路化的束縛,多了點(diǎn)人味,一看就是能走進(jìn)高考閱卷老師心坎的文章。

面對(duì)數(shù)學(xué)問題的拷問,GPT-4 Turbo 開始有些招架不住,不僅計(jì)算過程復(fù)雜,最終得出的結(jié)果也是錯(cuò)誤的,而日日新 5.0 這邊得出的答案則充滿條理性,也完全正確。

行業(yè)差異化是大模型競(jìng)爭(zhēng)中脫穎而出的關(guān)鍵因素。

瞄準(zhǔn)本土化應(yīng)用場(chǎng)景的日日新 5.0,在理解中文特有的文化和語境上是要優(yōu)于 GPT-4 Turbo 的。GPT-4 Turbo 既然不熟悉中文語境,自然也就無法準(zhǔn)確把握「老鷹捉小雞」這樣的本土游戲規(guī)則。

多模態(tài)能力被業(yè)界普遍視為實(shí)現(xiàn) AGI 的關(guān)鍵路徑。

從基準(zhǔn)測(cè)試結(jié)果上看,日日新 5.0 也能與 GPT-4V 打得火熱,并且互有勝負(fù)。在實(shí)際的案例演示中,日日新 5.0 支持的秒畫生成老象的效果更自然一些,而同樣的問題給到友商,甚至還會(huì)出現(xiàn)三條腿的謬誤。

基于同一 Prompt 生成的人像圖,商湯旗下秒畫生成的皮膚紋理自然,既沒有過度磨皮加濾鏡,也順利完成了「美麗」的指標(biāo) ?紤]到國際上用于訓(xùn)練 AI 模型的亞洲人像數(shù)據(jù)庫相對(duì)有限,這樣的對(duì)比結(jié)果也相對(duì)正常。

結(jié)合多模態(tài)和數(shù)據(jù)分析能力,AI 能夠?qū)崿F(xiàn)更為復(fù)雜和高級(jí)的任務(wù)。

日日新 5.0 上能「攻破」長(zhǎng)圖的總結(jié)描述,中能識(shí)別滴滴打車的具體信息,下還能計(jì)算中國特有早餐的熱量,同樣的問題給到 GPT-4 Turbo,也許就是兩眼一抹黑。

總說 AI 會(huì)重塑工作流,這一次,商湯也特別演示辦公小浣熊在這方面的能力。

將 F1 賽車手周冠宇三年的參賽記錄輸入到系統(tǒng)中,并讓它繪制出參與比賽數(shù)量的柱狀圖,這個(gè)任務(wù)看似簡(jiǎn)單,但實(shí)際上牽涉到復(fù)雜的識(shí)別難題。

在國際比賽中,周冠宇使用其英文名字參賽。傳統(tǒng)的大模型在處理這類涉及非英文常規(guī)拼寫或者特定人物的識(shí)別任務(wù)時(shí),往往表現(xiàn)不佳。而日日新 5.0 升級(jí)的辦公小浣熊雖然經(jīng)歷了一些波折,但最終還是順利繪制出來。

端側(cè)大模型,唯快不破

在武俠世界中,「天下武功,唯快不破」強(qiáng)調(diào)了速度在實(shí)戰(zhàn)中的重要性,而在大模型的戰(zhàn)役中,這一原則同樣適用。

隨著大模型技術(shù)的快速發(fā)展,不同應(yīng)用場(chǎng)景的需求日益顯現(xiàn),智能手機(jī)、電腦、VR 眼鏡等終端設(shè)備對(duì)大模型的使用頻率,性能速度,安全穩(wěn)定等提出了更高要求。

變得更務(wù)實(shí)的商湯在本次發(fā)布會(huì)也正式推出了 1.8B 的 SenseChat-Lite 版本端側(cè)⼤模型。

在基準(zhǔn)測(cè)試中,該端側(cè)模型全面超越了 MiniCPM-2B、Phi-2 等同量級(jí)的大模型,并且還越級(jí)比肩一些 7B、13B 大模型,用徐立的話來說,那就是同等尺度性能最優(yōu),跨級(jí)尺度全面領(lǐng)先。

研究表明,人眼最快的閱讀速度大概就是 20 字/秒,而搭載 1.8B 商湯端側(cè)模型在中端手機(jī)上能夠?qū)崿F(xiàn) 18.3 字/秒的速度,而在旗艦手機(jī)則最高支持 78.3 字/秒,成為業(yè)內(nèi)最快推理速度。

商湯還推出端云協(xié)同解決方案,可以通過智能化判斷協(xié)同發(fā)揮端云各自優(yōu)勢(shì),需要聯(lián)網(wǎng)搜索或處理復(fù)雜場(chǎng)景時(shí)分流至云端處理,部分場(chǎng)景端側(cè)處理占比超過 80%,從而顯著降低推理成本。

在與「商量」的寥寥幾秒對(duì)談中,無論是幾秒生成請(qǐng)假報(bào)告,還是總結(jié)幾千字的文檔都能快速響應(yīng)。

端側(cè)擴(kuò)散模型還能實(shí)現(xiàn)業(yè)內(nèi)最快推理速度,端側(cè) LDM-AI 擴(kuò)圖技術(shù)在某主流平臺(tái)上,推理速度小于 1.5 秒,比友商云端 app 快10倍,支持輸出 1200 萬像素及以上的高清圖片,支持在端上快速進(jìn)行等比擴(kuò)圖、自由擴(kuò)圖、旋轉(zhuǎn)擴(kuò)圖等圖像編輯功能。

現(xiàn)場(chǎng)的演示中,工作人員更是可以做到隨拍隨擴(kuò),將端側(cè)大模型「唯快不破」的能力展現(xiàn)得淋漓盡致。

并且,據(jù)徐立介紹,該端側(cè)大模型主要適用于日常對(duì)話、常識(shí)問答、文案生成、相冊(cè)管理、圖片生成、圖片擴(kuò)展等六大領(lǐng)域,還支持多設(shè)備適配,使其能夠靈活地應(yīng)用于各種不同的場(chǎng)景和設(shè)備之中。

對(duì)于金融、代碼、醫(yī)療、政務(wù)等重點(diǎn)行業(yè)邊緣側(cè)日益增長(zhǎng)的 AI 應(yīng)用需求,商湯還正式推出了高性價(jià)比、開箱即用、數(shù)據(jù)安全、全國產(chǎn)化的企業(yè)級(jí)應(yīng)用一體機(jī),涉及金融、醫(yī)療、政務(wù)、代碼等四大行業(yè)。

以政務(wù)智能咨詢問答平臺(tái)為例,它不僅能夠理解用戶提出的問題,還能提供答案的參考來源,極大地提升政務(wù)服務(wù)的智能化水平。

徐立指出,自然語言仍然不能替代編程語言,當(dāng)前的「AI 程序員」無法獨(dú)立完成復(fù)雜的工業(yè)級(jí)代碼項(xiàng)目,而 Copilot 才是更適合的形態(tài)。

因此,今天商湯還發(fā)布了小浣熊·代碼大模型一體機(jī)輕量版,單臺(tái)支持 100 人規(guī)模研發(fā)團(tuán)隊(duì)使用。支持?jǐn)?shù)據(jù)不出域,安全有保障,免費(fèi)部署即可開箱即用。每臺(tái)售價(jià) 35 萬元起,為中小企業(yè)用戶提供了高性價(jià)比的選擇。

今年以來,Sora 的出現(xiàn)讓人們見識(shí)到了 AI 視頻生成的無限創(chuàng)造潛力,徐立在最后環(huán)節(jié)也帶來了「One more thing」——三段完全由大模型生成的視頻。尚未上線的文生視頻生成平臺(tái)也在人物可控性、動(dòng)作可控性以及場(chǎng)景可控性等方面都有著出色的表現(xiàn)。

AI 應(yīng)用落地需要一個(gè)即插即用的大模型超市

在 GPT-4 發(fā)布一年后,大模型們依然在不斷卷參數(shù)刷榜。但今年行業(yè)里大家真正關(guān)心的,其實(shí)是怎么將大模型通過 Agent,并接入到無數(shù)企業(yè)和個(gè)人的工作流中。

OpenAI 的 GPT Store 沒有如愿成為 AI 行業(yè)的 GPT Store,但大量的需求和問題依然擺在那。大模型的強(qiáng)大的能力和落地不同行業(yè)場(chǎng)景之間缺乏暢通的橋梁,同時(shí)也意味著一個(gè)巨大的機(jī)遇。

商湯的日日新開放平臺(tái),實(shí)際上就是一個(gè)大模型超市。通過多模態(tài)的模型能力提升 API 的調(diào)用效率,降低企業(yè)和開發(fā)者調(diào)用和定制各種 AI 功能的門檻。

比起模型的規(guī)模參數(shù),商湯更側(cè)重于模型的能力應(yīng)用。從商湯針對(duì)金融、醫(yī)療、政務(wù)、代碼的行業(yè)大模型,到目前行業(yè)推理速度最快的端側(cè)模型,以及商量、 如影、大醫(yī)、小浣熊家族等 AI 原生應(yīng)用,都可能看出商湯想要提供接口更豐富,能執(zhí)行不同行業(yè)復(fù)雜任務(wù)的 AI 工具箱。

知名調(diào)研機(jī)構(gòu) Frost & Sullivan 發(fā)布的《2023年中國AI開發(fā)平臺(tái)市場(chǎng)報(bào)告》指出,SenseCore 商湯大裝置已成為中國 AI 開發(fā)平臺(tái)云計(jì)算基礎(chǔ)設(shè)施供應(yīng)商的領(lǐng)先者。在硬件基礎(chǔ)設(shè)施兼容性、產(chǎn)業(yè)鏈合作情況、模型訓(xùn)練優(yōu)化模塊、智能標(biāo)注技術(shù)能力、預(yù)訓(xùn)練模型技術(shù)水平5個(gè)評(píng)估項(xiàng)目中,商湯均獲得最高分。

我們前段時(shí)間報(bào)道過金山辦公的 WPS AI 企業(yè)版,其中合作的大模型就有商湯。金山表示商湯在數(shù)據(jù)分析上比較出色,因此 WPS AI 就調(diào)用它處需要理科思維的場(chǎng)景。

APPSO 把金山這種不生產(chǎn)大模型,而是堅(jiān)定做大模型應(yīng)用的公司,稱為 AI 的應(yīng)用主義者。而商湯在其中扮演的角色,與其說是大模型的提供商,不如說是幫助各行各業(yè)大規(guī)模應(yīng)用落地 AI 應(yīng)用的百貨超市。

什么是百貨超市?有著廣泛的產(chǎn)品線,能滿足不同消費(fèi)者大大小小的個(gè)性化需求。最重要的是,百貨超市的出現(xiàn)讓種類繁多的商品更容易被大眾獲取,讓更多普通人便捷享受到全世界的優(yōu)質(zhì)產(chǎn)品和體驗(yàn)。

而這,正是方興未艾的 AIGC 未來對(duì)我們最大的價(jià)值。而公司作為現(xiàn)代社會(huì)最偉大的發(fā)明之一,如果說大模型正在帶來第四次工業(yè)革命,大概率是從對(duì)企業(yè)的影響開始。已故的商湯創(chuàng)始人湯曉鷗也曾表示:

并不存在 AI 這個(gè)行業(yè),只有 AI+行業(yè),強(qiáng)調(diào) AI 需要與傳統(tǒng)產(chǎn)業(yè)合作,這種關(guān)系是結(jié)合與賦能,而不是顛覆,其價(jià)值在于幫助傳統(tǒng)產(chǎn)業(yè)提高生產(chǎn)效率,解放生產(chǎn)力。

湯曉鷗在一次演講中提到,「企業(yè)融資不是用來燒的,而是做偉大的事!苟虦萍嘉磥硎暌龅摹?jìng)ゴ蟮氖隆,將是幫助千行百業(yè)將 AIGC 落地。

文章來源:APPSO

 

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部