首頁 > 科技要聞 > 科技> 正文

中國移動(dòng)千億多模態(tài)大模型發(fā)布,「九天-九九」風(fēng)趣暢聊堪比GPT-4o

新智元 整合編輯:太平洋科技 發(fā)布于:2024-05-27 14:57

在通用大模型的時(shí)代浪潮中,中國移動(dòng),勇立潮頭,不落人后!

5月24日,在第七屆數(shù)字中國建設(shè)峰會中國移動(dòng)人工智能生態(tài)大會「AI賦能,智筑國基」主旨論壇上,中國移動(dòng)發(fā)布了最新自研的「九天」千億多模態(tài)基座大模型。

憑借自主研發(fā)與行業(yè)積累,「九天」基座大模型堪稱「國內(nèi)最值得信賴、最懂行業(yè)」的全棧大模型。

和其他企業(yè)不同,央企做大模型,是面向國民經(jīng)濟(jì)骨干行業(yè),目的是給國家基建轉(zhuǎn)型賦能,「為產(chǎn)業(yè)注智,為國家筑基」。

中國移動(dòng),當(dāng)?shù)闷鹨痪洹秆肫笕斯ぶ悄茴I(lǐng)頭羊」。

AI電聊對接會議,遇難題自主尋求人類幫助

GPT-4o發(fā)布當(dāng)天,向所有人展示了強(qiáng)大的AI語音助手能力,將電影「Her」中的Samantha帶入現(xiàn)實(shí)。

而中國移動(dòng)現(xiàn)場的直播演示,一點(diǎn)也不輸OpenAI。

九天·九九

首先上場的「九天·九九」,是一個(gè)定制化的個(gè)人助理。

兩位童鞋向在場所有人展示了,真正的AI助理,如何讓主人們效率倍升。

一邊是小天,一邊是九九。

小哥向自己的助手「小天」提問:「我有點(diǎn)緊張,怎么辦」?

暖心的小天開始為小哥出招,并為他加油打氣。

旁邊女生的助手「九九」則幫她生成了「3道關(guān)于二次函數(shù)的初中數(shù)學(xué)題」,并且在后續(xù)的追問下給出了詳細(xì)的解題步驟,分分鐘搞定初中生的指導(dǎo)。

接下來,九九還生成了一張六一兒童節(jié)的圖片,以「九天藍(lán)」為背景。

最后,九九還完成了一個(gè)非常實(shí)用的功能:告訴它自己的時(shí)間計(jì)劃,它就可以幫忙安排日程了,比如把后天上午9點(diǎn)的一個(gè)會議加入議程。

更厲害的是,小天和九九這兩個(gè)AI助手,直接在現(xiàn)場互通電話對接起了開會需求,完全沒有主人們的事兒了。

九天·善學(xué)

另一個(gè)在演示中登場的,是「九天·善學(xué)」。

作為一個(gè)基于知識數(shù)據(jù)和專家指導(dǎo)的產(chǎn)品,它可以協(xié)助我們進(jìn)行專業(yè)的行業(yè)分析或產(chǎn)業(yè)洞察。

而且,如果我們有一個(gè)待完善的工作,也可以驅(qū)動(dòng)模型與專家對話來進(jìn)行修正。

比如它在撰寫方案時(shí)遇到了一個(gè)網(wǎng)絡(luò)運(yùn)維方面的問題,會主動(dòng)開始詢問人類專家。

在兩位專家給出建議后,它就可以自動(dòng)進(jìn)行相關(guān)的更新和修改。

九天·網(wǎng)絡(luò)

「九天·網(wǎng)絡(luò)」則向我們展示了復(fù)雜系統(tǒng)如何完成全局的智能感知。

演示過程中,杭州亞運(yùn)會場館以及周邊區(qū)域被3D復(fù)刻到了孿生數(shù)字世界,而且對通信網(wǎng)絡(luò)的信號覆蓋范圍進(jìn)行了可視化的渲染

基于此,「九天·網(wǎng)絡(luò)」可以感知網(wǎng)絡(luò)狀態(tài)、設(shè)備狀態(tài)以及用戶體驗(yàn)。

全局的監(jiān)測和感知結(jié)果也可以用可視化的方式呈現(xiàn)出來,信號的光圈使各處的網(wǎng)絡(luò)狀態(tài)清晰可見,在下面的圖片中,黃色區(qū)域表示信號比較好、紅色是信號比較擁堵的地方,甚至可以追蹤路上的某一個(gè)人,從用戶個(gè)體的角度出發(fā)進(jìn)行分析。

運(yùn)維人員在檢查設(shè)備時(shí)可以戴著AR眼鏡,視覺監(jiān)測能力可以協(xié)助分析設(shè)備情況,并直接將分析結(jié)果疊加在運(yùn)維人員的視覺范圍中。

此外,也可以讓遠(yuǎn)程專家參與進(jìn)來,對設(shè)備的檢修、維護(hù)進(jìn)行指導(dǎo)。

千億參數(shù)+多專家架構(gòu)

以上所展現(xiàn)的產(chǎn)品和能力,全部來自中國移動(dòng)「九天」千億多模態(tài)基座大模型的加持。

而要實(shí)現(xiàn)如此復(fù)雜且智能的基座大模型,就需要在模型架構(gòu)和參數(shù)規(guī)模上不斷進(jìn)行技術(shù)突破。

中國移動(dòng)從2013年起就已經(jīng)開展人工智能的自主研發(fā),在同一領(lǐng)域深耕十年、持續(xù)積累,讓「九天」大模型取得了技術(shù)領(lǐng)先的地位。

「九天」基座大模型采用純解碼與多專家相結(jié)合的架構(gòu),創(chuàng)新了模型的學(xué)習(xí)方式——通過結(jié)構(gòu)化數(shù)據(jù)建模,進(jìn)行漸進(jìn)式學(xué)習(xí)。

模型的參數(shù)量,從曾經(jīng)的十億、百億不斷攀升至最新千億級別。

為適應(yīng)不同的應(yīng)用場景,「九天」提供1.5B、3B、7B、13.9B、100+B等不同參數(shù)量的模型版本,可靈活部署于各種設(shè)備和平臺

不僅如此,中國移動(dòng)還在醞釀下一步更大的訓(xùn)練計(jì)劃,將數(shù)據(jù)集規(guī)模從5萬億提升至20萬億token,進(jìn)一步提升模型能力。

有如此前沿的架構(gòu)和龐大的參數(shù)量,「九天」在國際競賽中的表現(xiàn)可謂是十分突出:

在語音合成領(lǐng)域,在2024年INTERSPEECH語音合成聲碼器賽道中獲得國際第一名。

視覺評測方面也同樣出色,獲得2023年CVPR VSS(視覺語義分割)賽道中視覺理解方面的第一名。

對照MME-P榜單,「九天」基座大模型的生成能力相當(dāng)于全球第9名的水準(zhǔn)。

除了競賽成績喜人,各類測試中的評測結(jié)果也十分優(yōu)異。

我們熟知的多語言理解MMLU、編碼HumanEval、數(shù)學(xué)GSM8K基準(zhǔn)中,「九天」基座大模型都取得了不俗的表現(xiàn)。

還有在中文C-Eval、MBPP、BBH基準(zhǔn)上,基座大模型取得了領(lǐng)先的優(yōu)勢。

此外,在11個(gè)行業(yè)領(lǐng)域,中國移動(dòng)對基座模型展開了124個(gè)細(xì)類,多達(dá)8萬多道大學(xué)考試或職業(yè)資格考試題的測試,結(jié)果如下圖所示。

「九天」基座大模型在11個(gè)領(lǐng)域均拿下了最高成績。

這些發(fā)布會上的「智能」表現(xiàn),以及競賽和測評中令人印象深刻的成果,完全配得上它「最懂行業(yè)」的定位。

復(fù)雜系統(tǒng)智能化

作為全棧大模型,「九天」讓自己的能力面向各種復(fù)雜行業(yè)需求,提出了「復(fù)雜系統(tǒng)智能化」的理念,旨在為產(chǎn)業(yè)「注智」。

大模型的「智能」說起來容易,但實(shí)現(xiàn)起來卻很困難,需要攻克許多的難題和壁壘。

為了實(shí)現(xiàn)面向復(fù)雜系統(tǒng)智能化,中國移動(dòng)集團(tuán)首席科學(xué)家馮俊蘭等專家,做了大量的工作。

如果說AI是一個(gè)大海,現(xiàn)在的智能還僅僅停留在表面。想要走向深水區(qū),除了推理、生成、推理這些通用能力,還需要對復(fù)雜系統(tǒng)進(jìn)行感知、預(yù)測、診斷、控制和決策。

大部分復(fù)雜系統(tǒng),都是一個(gè)混沌的系統(tǒng)。怎樣才能從微觀走向宏觀,從混沌走向清晰?

這就需要結(jié)構(gòu)化的數(shù)據(jù)。因?yàn)樵趶?fù)雜系統(tǒng)中,會有大量的設(shè)備,大量的數(shù)據(jù)。

此外,還有多信源的數(shù)據(jù),讓AI可以看我所看,為我所為,聽我所聽。

怎么去表征好這些信號,和通用的模態(tài)數(shù)據(jù)進(jìn)行融合,就是復(fù)雜系統(tǒng)實(shí)現(xiàn)真正AI的關(guān)鍵。

總的來說,復(fù)雜系統(tǒng)智能化需要解決兩大問題:一是大而不穩(wěn),二是多而不合。

為此,中國移動(dòng)在「九天」基座大模型的研發(fā)過程中使用了多種策略和技術(shù),包括多層信息加固、溯源信息場一致性校驗(yàn)、大小模型協(xié)同等。

這幾種技術(shù)的結(jié)合使用,將「九天」模型打造成為面向「原子化任務(wù)」的智能體。

不僅有當(dāng)下前沿大模型的理解、生成、推理能力,還以此為基礎(chǔ),進(jìn)一步延展出感知、預(yù)測、診斷、控制、決策等更加「類人」的能力。

從每個(gè)行業(yè)的微觀數(shù)據(jù)到泛行業(yè)模型的宏觀生態(tài),從混沌、復(fù)雜的問題中提取清晰、簡單的解決路徑,這就是「復(fù)雜系統(tǒng)智能化」想要實(shí)現(xiàn)的目標(biāo)。

打通模態(tài)信源

「九天」之所以將自己定位為通用的「全!勾竽P,原因之一是打通了各個(gè)模態(tài)之間的隔閡,實(shí)現(xiàn)復(fù)雜的大模型系統(tǒng)在「全模態(tài)」之間的智能化推理。

不僅包含語音、語言、視覺這些常見的模態(tài),而且囊括了結(jié)構(gòu)化數(shù)據(jù),讓模態(tài)的設(shè)計(jì)都更加匹配各行各業(yè)中的落地場景。

另一個(gè)原因在于,中國移動(dòng)發(fā)揮自己在通信領(lǐng)域的龍頭地位,讓大模型可以在各種信源和設(shè)備上靈活部署。

當(dāng)前的大模型由于參數(shù)過大、設(shè)備兼容性低等原因,一般只能在服務(wù)器或PC端進(jìn)行推理,但能夠提供云邊端全面服務(wù)的中國移動(dòng)表示不服。

「九天」大模型不僅可以部署在常見的移動(dòng)電子設(shè)備和物聯(lián)網(wǎng)傳感設(shè)備上,比如智能手機(jī)、平板、汽車和穿戴設(shè)備,還能應(yīng)用于各種復(fù)雜信源,包括雷達(dá)、紅外、聲波、無線射頻等等。

這些復(fù)雜信源雖然人類難以感知,但對工業(yè)生產(chǎn)、通信、服務(wù)領(lǐng)域的一些支柱性行業(yè)至關(guān)重要。

對多種信源的強(qiáng)大適配能力,讓「九天」輕松走入各行各業(yè)的場景,快速落地應(yīng)用。

聚焦骨干行業(yè)

國內(nèi)外市場上大模型層出不窮,為什么只有「九天」敢宣稱自己「最懂行業(yè)」?

從模型定位、訓(xùn)練數(shù)據(jù)到AI生態(tài)、應(yīng)用場景,「九天」的研發(fā)團(tuán)隊(duì)始終沒有忘記自己「聚焦行業(yè)」的初衷——

讓最前沿的AI模型服務(wù)于骨干行業(yè)的技術(shù)革新,服務(wù)于國家基礎(chǔ)設(shè)施的智能轉(zhuǎn)型。

因此,「九天」定位為面向復(fù)雜行業(yè)系統(tǒng),要在政府治理、工業(yè)生產(chǎn)、民生服務(wù)、通信特色這四大領(lǐng)域發(fā)揮重要作用,提供基座模型。

從訓(xùn)練開始,「九天」基座模型就與行業(yè)緊密相連——不僅集成通信、能源、建筑、交通等八大行業(yè)的專業(yè)知識,而且行業(yè)數(shù)據(jù)在所有預(yù)訓(xùn)練數(shù)據(jù)中的占比達(dá)到10%,超過了所有國內(nèi)和國際的同行。

另外,對于結(jié)構(gòu)化數(shù)據(jù)的處理,就著重考慮了營銷、出行等行業(yè)應(yīng)用,增強(qiáng)了模型的網(wǎng)絡(luò)智能化實(shí)戰(zhàn)經(jīng)驗(yàn),較傳統(tǒng)手段有10%-15%的提升,解決了大模型無法準(zhǔn)確處理結(jié)構(gòu)化數(shù)據(jù)的難題。

在視覺理解領(lǐng)域,訓(xùn)練數(shù)據(jù)就包含了7000萬路視聯(lián)網(wǎng),以及200億+咪咕圖、文、視頻等行業(yè)特色數(shù)據(jù),讓模型不僅「看得清」、「看得懂」,而且「看得準(zhǔn)」。

在「九天」基座模型的基礎(chǔ)上,中國移動(dòng)已經(jīng)建立了一整套面向全行業(yè)的大模型體系和AI生態(tài),共開發(fā)出15款行業(yè)大模型。

全面支持自主生態(tài)

作為AI行業(yè)的「國家隊(duì)」選手,中國移動(dòng)站在AI技術(shù)的浪潮之巔,用實(shí)際行動(dòng)表明了獨(dú)立自主研發(fā)的決心,顯示了央企應(yīng)有的擔(dān)當(dāng)。

在研發(fā)「九天」大模型體系的過程中,研發(fā)團(tuán)隊(duì)同時(shí)致力于在算力、芯片、框架、算法等領(lǐng)域?qū)崿F(xiàn)AI生態(tài)的「國產(chǎn)化」。

在芯片層面,「九天」系列大模型解決了一大訓(xùn)練難題——在異構(gòu)芯片之間轉(zhuǎn)換。

在11個(gè)廠家生產(chǎn)的17款不同芯片上,團(tuán)隊(duì)完成了適配、遷移、測試和標(biāo)準(zhǔn)拉齊等一系列工作,從而支持模型在異構(gòu)芯片間平滑轉(zhuǎn)化和繼續(xù)訓(xùn)練。

為了助推國內(nèi)AI產(chǎn)業(yè)加速發(fā)展,中國移動(dòng)還提出了「萬千百」智能基座計(jì)劃,打造「萬卡大算力、千億大模型、百匯大平臺」。

在算力層面,中國移動(dòng)將建成3個(gè)兩萬卡智算中心和12個(gè)區(qū)域智算中心。

目前,已經(jīng)在呼和浩特建成的超大單體智算中心,規(guī)模超越了全球范圍內(nèi)所有運(yùn)營商,成為央企「十大超級工程」之一。

隨著AI大規(guī)模落地,對推理算力需求激增,中國移動(dòng)還將全面升級已經(jīng)部署的1500個(gè)邊緣計(jì)算節(jié)點(diǎn),提升訓(xùn)推算力資源配比達(dá)到1:10,即1卡訓(xùn),10卡推。

年底,全網(wǎng)大模型訓(xùn)練卡達(dá)到10萬卡+,規(guī)模將會超過30 EFLOPS。

其次,中國移動(dòng)還將升級算網(wǎng)大腦新中樞,并構(gòu)建數(shù)聯(lián)網(wǎng)的新保障。

「百匯大平臺」上,還會匯聚豐富的大小模型、數(shù)據(jù)集及AI原生應(yīng)用,集模型體驗(yàn)、下載、調(diào)優(yōu)、部署、應(yīng)用、測評等多種功能為一體,為創(chuàng)業(yè)者和開發(fā)者提供「一站式」服務(wù)平臺。

模型安全可信

「九天」系列大模型之所以「值得信賴」,不僅體現(xiàn)在支持國產(chǎn)化的自主研發(fā),還根植于對模型安全性的高標(biāo)準(zhǔn)、嚴(yán)要求。

為了解決大模型在應(yīng)用中面臨的「遺忘」、「幻覺」等共性痛點(diǎn),團(tuán)隊(duì)在訓(xùn)練中應(yīng)用了知識升維融合、持續(xù)動(dòng)態(tài)學(xué)習(xí)等關(guān)鍵技術(shù)。

此外,模型還配備了完善的數(shù)據(jù)安全、系統(tǒng)安全等保障機(jī)制,真正達(dá)到安全、可信、可控。

這種對于安全性的執(zhí)著追求,最終得到了官方的認(rèn)可。

「九天」自然語言交互大模型同時(shí)通過了「生成式人工智能服務(wù)備案」與「境內(nèi)深度合成服務(wù)算法備案」,成為首個(gè)央企研發(fā)的完成雙備案的大模型。

在中國軟件測評中心開展的測試中,「九天」大模型也獲得了最高等級(A級)的安全性認(rèn)證。

十年磨劍,跨越式發(fā)展

在一系列卓越的成就背后,是整個(gè)集團(tuán)創(chuàng)「世界一流信息服務(wù)科技創(chuàng)新公司」和勇?lián)鷩铱苿?chuàng)重任的雄心,以及研發(fā)團(tuán)隊(duì)十年如一日地努力前進(jìn)、力爭上游的決心。

IEEE Fellow、中國移動(dòng)集團(tuán)首席科學(xué)家馮俊蘭博士是整個(gè)AI領(lǐng)域的領(lǐng)頭人。

她在2013年9月加入了中國移動(dòng)研究院,也就是那個(gè)時(shí)候,這家運(yùn)營商已經(jīng)嗅到AI的未來潛力。

十年間,馮俊蘭博士帶領(lǐng)團(tuán)隊(duì)在AI技術(shù)研發(fā)上一步步篳路藍(lán)縷、穩(wěn)扎穩(wěn)打,親歷了公司在AI領(lǐng)域?qū)崿F(xiàn)「跨越式」發(fā)展的全過程。

如今,中國移動(dòng)成立了「九天」人工智能研究院,引入2名千人專家、超150個(gè)AI 專業(yè)博士,形成2000人AI核心團(tuán)隊(duì),開展了人工智能基礎(chǔ)技術(shù)、算法、平臺、應(yīng)用的全棧研發(fā),具備了大模型數(shù)據(jù)構(gòu)建、預(yù)訓(xùn)練、微調(diào)、推理等全鏈路技術(shù)的自主創(chuàng)新能力。

在去年,中國移動(dòng)相繼發(fā)布了「九天·客服」、「九天·海算政務(wù)」、「九天·網(wǎng)絡(luò)」等垂直行業(yè)大模型,以及面向骨干行業(yè)開放共建的「九天·眾擎基座大模型」,在大模型賽場上發(fā)出了響亮的央企聲音。

除了發(fā)布的產(chǎn)品和模型,中國移動(dòng)還取得了豐碩的科研成果——原創(chuàng)性提出了體系化人工智能(Holistic AI)技術(shù),受到產(chǎn)學(xué)研各界的廣泛認(rèn)可和支持。

榮獲中國通信學(xué)會科技進(jìn)步獎(jiǎng)一等獎(jiǎng),申請超過930項(xiàng)專利,發(fā)表160余篇頂會頂刊論文 ,并在約20個(gè)大型國際競賽中取得TOP 5的成績。

展望未來,正如這次大會的主題「AI賦能,智筑國基」,中國移動(dòng)將肩負(fù)AI「國家隊(duì)」的使命繼續(xù)前行,把AI領(lǐng)域最前沿的進(jìn)展帶入千家萬戶、千行百業(yè)。

本文來源:新智元

新智元

網(wǎng)友評論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部