首頁 > 科技要聞 > 科技> 正文

國產(chǎn)大模型卷翻機器人!這些火遍全網(wǎng)的機器人,都裝上了星火「大腦」

新智元 整合編輯:龔震 發(fā)布于:2024-04-25 20:59

大模型,已然卷入機器人領(lǐng)域。

3月初,初創(chuàng)公司Figure發(fā)布了首個由OpenAI大模型加持的人形機器人Figure 01的演示。

憑借LLM「大腦」,F(xiàn)igure 01可以看到桌面上的蘋果,動手收拾餐具,并與人類進行無縫交流。

在電動Atlas官宣當天,初創(chuàng)公司Mentee Robotics也展示了首個Menteebot人形機器人,通過自然語言即可交流。

同樣,得到大模型加持的Menteebot,能解釋命令,并思考、決策、完成任務。

在大模型浪潮下,類似的案例近一年來層出不窮。

反觀國內(nèi),大模型助推下,機器人領(lǐng)域也是熱度不減。

年初,具有「人形機器人第一股」之稱的優(yōu)必選股價創(chuàng)下2天3倍的暴漲走勢,與之呼應的是大模型廠商近期與機器人行業(yè)的合作也是動作不斷。

有行業(yè)專家表示,具備多模態(tài)LLM大腦的機器人時代終于來臨了。這些機器人將能夠理解指令并執(zhí)行任務:可以使用筆記本、刷碗、沖泡咖啡,妥妥的AGI!

顯然,大模型賦能機器人蘊藏著巨大的潛力,成為科技大廠為數(shù)不多的一個共識。

「具身智能」大爆發(fā),元年已來

人們都說,2024年是機器人的元年。

大模型的橫空出世,無疑讓機器人行業(yè)再次成為研究界和產(chǎn)業(yè)界的一大亮點。

先來看一張圖,直觀地感受下,當前全世界取得進展的機器人公司。

正如許多人期待的那樣,AGI真正到來的那天,「具身智能」正是不可或缺的重要硬件載體。

從過去一年至今,機器人領(lǐng)域的投資市場不斷持續(xù)升溫,迎來了高光時刻。

研究公司Robot Report數(shù)據(jù)顯示,今年前3個月,機器人初創(chuàng)公司籌集了32億美元資金,去年同期為17億美元。

在國外,OpenAI押注的兩家人形機器人初創(chuàng)公司1X、Figure紛紛得到新一輪的融資。

還有硅谷服務機器人Bear Robotics、專為機器人開發(fā)大腦Physical Intelligence、還未創(chuàng)收的Skild等機器人初創(chuàng)公司,同樣受到資本的追捧。

國內(nèi)以優(yōu)必選為代表,2023年12月底上市即成為人形機器人第一股;如前所述,股票一路攀升。

不久前,工業(yè)版人形機器人Walker S都已經(jīng)進入車間開始打工了。

此外,宇樹人形機器人在今年2月完成了近10億元的B2輪融資,其產(chǎn)品宇樹H1更是火到了國外。

根據(jù)網(wǎng)友的統(tǒng)計,僅在今年第一季度,國內(nèi)機器人市場就有20多起融資案例。

來源:網(wǎng)絡

可見,大量資本的注入,將機器人行業(yè)的熱潮推向了最高點。

實際上,對于每個人來說,機器人早已不是什么新鮮事物。

為什么大模型的加入,讓其迎來了ChatGPT時刻?

為什么需要多模態(tài)LLM

眾所周知,傳統(tǒng)機器人有著一個明顯的局限性——需要明確的指令。

掌握單個技能,諸如開門、拉抽屜、拾取和操縱某物,對于它們來說,并不難。

然而,想要讓機器人去完成多個技能結(jié)合的任務,是非常困難的。

這就是為什么大模型的出現(xiàn),破解了傳統(tǒng)機器人需要明確指令,才能執(zhí)行任務的僵化問題。

簡單來說,LLM可以將松散定義的指令,映射到機器人技能范圍內(nèi)的特定任務序列。

比如,當你對機器人點頭時,如何讓它也能友好地向你點頭?

來自多倫多大學、谷歌DeepMind等機構(gòu)開發(fā)的GenEM,利用GPT-4豐富的知識儲備,將「點頭」這一抽象行為,轉(zhuǎn)化為機器人可輸出的特定動作。

然而,通往具身智能AGI的路上,僅依靠大語言模型是不夠的。

這是因為,圖像、文字、語音、視頻等各種多模態(tài)信息,構(gòu)成了我們的現(xiàn)實世界。而人類的感受、溝通,都是在以多模態(tài)形式進行。

對于智能機器人來說,也是必須具備的能力。

比如,當機器人想要正確執(zhí)行「有點累,幫我去拿一杯提神的飲品」這條指令時,最關(guān)鍵是完成「多模理解」。

看到桌面上的一堆食物,哪個才是咖啡呢?

在理解語音指令、拆解任務步驟之后,機器人需要識別「視線」里的物體,判斷推理出哪瓶飲料是符合指令意思需要拿取的。

不僅如此,嗅覺、味覺之類的智能,也將是機器人未來逐漸擴展的領(lǐng)域。

總而言之,多模態(tài)能力對于真正要進入家庭的機器人來說必不可少,尤其是多模理解尤為重要。

國產(chǎn)頂流:訊飛星火大模型

看得出,市場對機器人的熱情,已完全被AI大模型點燃。

國內(nèi)一家成立25年的公司,曾在2022年就啟動了「超腦2030計劃」,暢想著能夠讓機器人走進每個家庭。

這一計劃共分為三個階段,通過逐步推進,讓AI可以懂知識、善學習、能進化。

一直以來,基于對前沿技術(shù)的不斷探索,背后這家公司——科大訊飛正朝著目標前進。

先是在2022年科大訊飛全球1024開發(fā)者大會上,首次發(fā)布了「訊飛機器人超腦平臺」。

這一平臺面向開發(fā)者,提供了全棧的工具鏈,包括模型訓練、資產(chǎn)生成和軟硬件接入等等。

ChatGPT引爆大模型熱潮之后,科大訊飛在23年5月首次發(fā)布「訊飛星火大模型」,并在一年多的時間完成了5次迭代。

而初代訊飛星火大模型就具備了體現(xiàn)通用人工智能的七大維度,包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力以及多模態(tài)能力。

在接下來的6月、8月、和10月以及今年1月,訊飛星火大模型完成了從V1.5、V2.0,到V3.0、V3.5的迭代升級。

大模型打破傳統(tǒng)認知智能的天花板,為機器人更加深入地理解世界奠定了堅實的基礎(chǔ)。

然而,要充分整合這些先進技術(shù),以促進機器人在人機互動、任務規(guī)劃和環(huán)境適應等方面的顯著進步,還需要依賴專門的系統(tǒng)。

為「機器人超腦平臺」注入靈魂

為此,科大訊飛在2023年7月正式將訊飛星火大模型與「機器人超腦平臺」進行了深度的融合。

具體來說,科大訊飛機器人超腦平臺,是以訊飛超腦2030技術(shù)為底座打造的,一個面向物理世界、虛擬世界和元宇宙的機器人開發(fā)平臺。

它以多模態(tài)感知表達、開放式語義理解、大小腦協(xié)同運動控制和軟硬件接入為核心,可以幫開發(fā)者快速搭建實體機器人和虛擬數(shù)字人產(chǎn)品。

如今,人形機器人在實際應用時,面臨的挑戰(zhàn)更多了。

你是不是經(jīng)常在商場遇到機器人,雞同鴨講,根本講不了兩句話,就被逼瘋了?

在這樣的嘈雜環(huán)境中,人與機器人的交互,簡直難上加難。

又或是,當你讓機器人講一個笑話時,那一本正經(jīng)的播音腔,簡直就是尷尬氛圍組上線。

而破解這些問題的關(guān)鍵是,讓機器人更好地「拾音」,且說話不再有那么重的「機器味兒」。

訊飛機器人超腦平臺從「視聽融合的多模態(tài)感知交互」和「大模型理解決策」兩個方面,解決了這一難題。

首先,就是打造機器人交互的新范式。

為此,訊飛機器人超腦平臺融合了語音、視覺、語義等多個維度的信息。

通過升級麥克風陣列算法,融合聲音、人臉、和唇形信息,即使在嘈雜、高噪的場景下,機器人都能精準拾音,實現(xiàn)復雜場景「聽得清」。

同時,通過語音大模型和超擬人合成技術(shù),機器人「聽得準」,「答得自然」,讓機器人聊起天來更有生命力和感染力了!

其次,就是機器人的交互大腦。

這個大腦,毫無疑問就是基于訊飛星火大模型,實現(xiàn)了控制級指令、官方技能、核心業(yè)務功能、快速知識問答、閑聊陪伴等多交互場景的統(tǒng)一。

對于每個孩子來說,如果機器人能以媽媽的聲音、口吻講睡前故事,才堪稱真正的「陪伴」機器人。

但若要實現(xiàn)這一點,還需要機器人具備情感化和高表現(xiàn)力的合成能力。

對此,訊飛機器人超腦平臺還設計了多風格、多情感的AI人設,能夠讓每個機器人都與眾不同。

順便提一句,訊飛機器人超腦平臺的虛擬人驅(qū)動協(xié)議已全面開放。

三方數(shù)字人產(chǎn)品通過接入該驅(qū)動協(xié)議,可以實現(xiàn)與訊飛數(shù)字人同等的交互效果。

訊飛機器人超腦平臺已賦能四大領(lǐng)域398家機器人客戶,深度鏈接1.3萬名機器人開發(fā)者。

官網(wǎng)地址:https://aibot.xfyun.cn

星火加持,機器人飛升

為了進一步擴大合作生態(tài),2024年4月15日,科大訊飛正式啟動「星河行動」計劃,招募生態(tài)合作伙伴共同推進機器人產(chǎn)業(yè)的繁榮。

而在此之前,有很多來自不同細分領(lǐng)域的國內(nèi)頭部機器人廠商,就已經(jīng)用上了科大訊飛星火大模型的強大能力。

當前,在許多人看來,人形機器人是最好的通用具身形態(tài)。

當機器人走向落地,人形并不一定是完成任務最好的形態(tài)。它可以是一個機械臂,也可以是輪式......

科大訊飛與穿山甲機器人公司合作已久,一直共同探索AI技術(shù)與機器人的融合,不斷拓寬服務機器人應用新的邊界。

這家公司旗下新款小魚、艾米、小雪等AI服務機器人,全都搭載了訊飛機器人超腦平臺,以及訊飛星火大模型技術(shù)。

基于訊飛先進的語音識別、AI技術(shù),機器人可以流暢地進行自然語言對話,迅速理解并給出準確回答。

同時,憑借著豐富的技術(shù)儲備,它們還能提供各類信息和建議。

穿山甲機器人已廣泛應用到餐飲、政務、教育、醫(yī)療等領(lǐng)域

當然還有家庭服務機器人,樂天派便是其中的代表之一。

通過接入訊飛星火大模型和多模態(tài)交互,這款桌面黑科技機器人成為孩子們的貼心「小管家」。

只需要一聲呼喚,不論是娛樂、還是遇到學習生活難題,它都能以前所未有交互能力陪伴孩子。

而在頭部人形機器人中,也少不了科大訊飛核心技術(shù)的身影。

我們熟知的,智元機器人、優(yōu)必選、宇樹科技等公司,都得到了訊飛全鏈路語音,以及訊飛星火大模型的加持。

還有近日官宣合作的EX機器人,更是將雙方各自優(yōu)勢完美結(jié)合。

基于訊飛機器人超腦平臺,將訊飛星火大模型和多模態(tài)交互技術(shù)應用到EX仿生機器人中,實現(xiàn)了與人一樣的思考、對話和動作。

除以上的案例之外,科大訊飛生態(tài)「朋友圈」還在不斷擴大。

機器人開發(fā),最好的時代

我們還應該看到,機器人的發(fā)展不僅依靠AI大腦的技術(shù)迭代,還需要「身體」并行。

隨著機器人行業(yè)的逐步發(fā)展,機器人行業(yè)內(nèi)的組件供應也開始向?qū)I(yè)化、成熟化方向發(fā)展。

4月2日,在上海召開的中國人形機器人生態(tài)大會上,可以看到機器人部件廠商也獲得了長足的發(fā)展——

人形機器人通用底座、機器狗通用底座、機器人超腦板、多模態(tài)語音交互、3D視覺芯片、靈活機械手、機器人伺服電機、3D打印框架等廠商均參加展出。

會場進行了多項專題報告,比如「多模態(tài)+大模型,構(gòu)建人形機器人新交互」、「人形機器人感知技術(shù)與發(fā)展」等細分領(lǐng)域的成果展示。

對于機器人行業(yè)的創(chuàng)業(yè)者和開發(fā)者來說,這將是最好的時代!

大量模塊化、可快速整合的行業(yè)平臺及部件,讓機器人的開發(fā)不再需要像過去一樣,從0開始做算法。

尤其是,像訊飛機器人超腦平臺已經(jīng)引入大模型的通用開放平臺,進一步將機器人的常規(guī)算法和人機交互開發(fā)難度降低到了「拿來即用」的地步。

再加上,訊飛機器人超腦平臺已經(jīng)打通了對接鏈路公司(宇樹、智元、EX機器人等)的成熟機器人硬件體系。

這意味著,二次應用開發(fā)將會成為入行最快、產(chǎn)品最快滿足客戶需求的方式之一。

顯然,機器人底層硬件配套已初步具備,LLM技術(shù)更是賦予了機器人交互的核心。

接下來,針對客戶需求的挖掘、痛點解決方案和用戶貼身服務的內(nèi)容,尚需進一步打磨。

這,將是機器人行業(yè)萬眾創(chuàng)業(yè)的開端。

大模型+機器人,前景一片大好

下一步,就是在LLM和機器人加速融合后,如何推動商業(yè)化落地?

從認知能力上來看,AI機器人的發(fā)展愈加接近人類。甚至,在外表方面,也變得更像人類了。

波士頓咨詢公司(BCG)估計,到2030年,全球機器人市場規(guī)模將達到1600億美元-2600億美元。

也就說,LLM+機器人未來的市場前景非常廣闊,可以深入應用于各種工業(yè)領(lǐng)域和人類生活場景。

在制造業(yè)領(lǐng)域,裝配線上的機器人能夠生產(chǎn)出,人類工人無法比擬的高質(zhì)量和一致性的商品。

在倉庫和物流公司中,AI機器人能夠完成重型搬運工作,諸如運送產(chǎn)品、放置在貨架等任務,大大減輕了人類勞動力的負擔。

就比如,亞馬遜物流倉庫中的75萬機器人大軍,已全面投入了使用。

除了工業(yè)領(lǐng)域的機器人,AI醫(yī)療機器人還可以幫助醫(yī)生做手術(shù),做出更準確的診斷,也能引導患者完成物理治療和康復。

展望未來,在餐館、太空探索、教育、養(yǎng)老院等諸多場景中,都將得到AI機器人的全面覆蓋。

不難料到,機器人的曙光已經(jīng)到來,它正在以我們幾十年前只能想象的方式重塑整個世界。

科大訊飛所做的,就是用技術(shù)革新,讓機器人走進每個家庭。

參考資料:

https://aibot.xfyun.cn

https://news.zol.com.cn/867/8673954.html

https://venturebeat.com/ai/how-llms-are-ushering-in-a-new-era-of-robotics/

文章來源:新智元

 

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部