首頁(yè) > 科技要聞 > 科技> 正文

“三步一條機(jī)器狗,五步一個(gè)數(shù)字人”

AI鯨選社 整合編輯:太平洋科技 發(fā)布于:2024-07-10 15:56

2024年,AI領(lǐng)域有一件事情可以確定,以后年度最盛大的AI春晚將非WAIC(世界人工智能大會(huì))莫屬了。

2023年WAIC雖有馬斯克遠(yuǎn)程視頻演講,但熱鬧程度還達(dá)不到全民關(guān)注,2024年的WAIC,無(wú)論是現(xiàn)場(chǎng)氣候的溫度(很多人說(shuō)40℃),還是現(xiàn)場(chǎng)人氣的熱度(30萬(wàn)人次),都創(chuàng)造了新高(同比增長(zhǎng)了90%)。

據(jù)悉,這屆大會(huì)的展覽面積超過(guò) 5.2 萬(wàn)平方米,500 余家知名企業(yè)、超過(guò) 1500 項(xiàng)展品參展,50 余款新品首秀。不僅更多的大模型企業(yè)參展,更熱鬧的是機(jī)器人/數(shù)字人等可視化AI產(chǎn)品,以及AI PC和AI眼鏡等硬件產(chǎn)品帶來(lái)的熱度,都讓大家更能具體感知“智能時(shí)代”的來(lái)臨。

而隨著更新潮的概念“具身智能”被大眾知曉,不少網(wǎng)友也感慨這屆WAIC,簡(jiǎn)直是“三步一條機(jī)器狗,五步一個(gè)數(shù)字人”。

根據(jù)組委會(huì)公布的信息,WAIC 2024共推動(dòng) 24 個(gè)重大產(chǎn)業(yè)項(xiàng)目的簽約,預(yù)計(jì)總投資額超過(guò) 400 億元。這其中大模型、機(jī)器人、數(shù)字人等貢獻(xiàn)了多少呢?

機(jī)器人、機(jī)器狗突然走向C位

幾年前,機(jī)器人領(lǐng)域還是底盤式和圓球手的機(jī)器人為主,而WAIC 2024上展示的大多數(shù)機(jī)器人已經(jīng)是雙腿式和關(guān)節(jié)手的機(jī)器人形態(tài)了。

走進(jìn)WAIC大門,就能看到多家機(jī)器人擺出的“十八金剛”人形機(jī)器人先鋒系列展覽。正如獵豹移動(dòng)董事長(zhǎng)傅盛在WAIC上參與了“AI三人行”的對(duì)話中,提到機(jī)器人為什么突然多了:“大模型技術(shù)已經(jīng)幫助機(jī)器人具備了規(guī)劃能力,使得原本復(fù)雜的工程變得更加簡(jiǎn)單!

最值得關(guān)注的機(jī)器人,要數(shù)特斯拉在WAIC上首發(fā)的Optimus二代人形機(jī)器人。這款機(jī)器人在直立行走的基礎(chǔ)上,行走速度提升了30%,并且手指具有感知和觸覺(jué)功能,能夠處理精細(xì)和重物搬運(yùn)任務(wù)。不過(guò)并沒(méi)有完全開(kāi)放展覽,而是封在玻璃柜中靜態(tài)展示。

“機(jī)器人第一股”達(dá)闥機(jī)器人也展示了其最新一代人形機(jī)器人XR4,并開(kāi)啟了預(yù)售。該機(jī)器人搭載了具身智能大模型RobotGPT,主要應(yīng)用于科研場(chǎng)景。

現(xiàn)場(chǎng)不僅有能做深蹲的人形機(jī)器人,會(huì)唱歌的數(shù)字人,還有會(huì)炒菜和倒咖啡的機(jī)器人,甚至自動(dòng)碼貨的物流機(jī)器人。這些人形機(jī)器人最多28個(gè)活動(dòng)關(guān)節(jié),越來(lái)越復(fù)雜和智能。

為什么要做人型機(jī)器人?“不是因?yàn)檫@是機(jī)器人的最優(yōu)形態(tài),而是因?yàn)檫@個(gè)世界的基建是圍繞著人類搭建!被蛟S是解答這么多家公司布局人型機(jī)器人的原因。

另一方面,很多家AI公司展示了四足形式的機(jī)器狗,也非常吸引大家關(guān)注。

作為推特上火起來(lái)的明星,宇樹科技憑借能后空翻的機(jī)器狗出圈。目前,其整機(jī)產(chǎn)品有6款機(jī)器狗(Go1、Go2、A1、B1、B2、Aliengo)、2款人形機(jī)器人(H1、G1),已落地的產(chǎn)品為巡檢、消防救援場(chǎng)景的機(jī)器狗。

云深處科技的X30機(jī)器狗也是展會(huì)明星,能認(rèn)得梵高畫作《星空》,以及具備感知人類情緒的能力,能夠主動(dòng)鼓勵(lì)主人,并給出舒緩心情的建議。此外,X30機(jī)器狗還擔(dān)負(fù)WAIC 的運(yùn)輸水業(yè)務(wù),出圈了一把。

當(dāng)然,機(jī)器人大熱背景下,泡沫也在浮現(xiàn)。在WAIC之前,李開(kāi)復(fù)就曾說(shuō),大多數(shù)應(yīng)用場(chǎng)景并不需要人形機(jī)器人,他認(rèn)為真正人形機(jī)器人成熟是在10年后,現(xiàn)在人型機(jī)器火得像已經(jīng)落地千行百業(yè)。

并且,現(xiàn)在熙熙攘攘的人型機(jī)器人,并未出現(xiàn)仿生式,各路機(jī)器人以套人形殼為主。其中大部分人型機(jī)器人還無(wú)法自主活動(dòng),要么是在后背加了懸吊,要么被固定在架子上。

剛具備初級(jí)智能,但還不能自由行動(dòng)機(jī)器人,還需要時(shí)間發(fā)展。

數(shù)字人第二階段是走向互動(dòng)

數(shù)字人在2022年就已經(jīng)大行其道,不過(guò)這些數(shù)字人主要是2D和3D虛擬人,更多是錄制短視頻或者宣傳片,也即沒(méi)法與人互動(dòng),少量走向直播間的數(shù)字人也普遍是“智障”。

2024年多模態(tài)大模型落地后,很多數(shù)字人終于可以實(shí)現(xiàn)語(yǔ)音/動(dòng)作互動(dòng),開(kāi)始走向前臺(tái)與消費(fèi)者直接接觸。

這屆WAIC上最受關(guān)注的數(shù)字人是“羅永浩”和“周鴻祎”,每個(gè)人都可以去現(xiàn)場(chǎng)與其互動(dòng)。

其中,“羅永浩”是智譜科技推出的以他本人為原型的數(shù)字人,這款數(shù)字人不僅外形酷似羅永浩,而且在語(yǔ)言表達(dá)和情感反應(yīng)上也比較逼真。"羅永浩數(shù)字人"能夠進(jìn)行行業(yè)分析和產(chǎn)品講解,不能指望什么都能回答,但能對(duì)話個(gè)7788。

周鴻祎”是360公司展示的"知識(shí)官數(shù)字人",這款數(shù)字人不僅能夠提供網(wǎng)絡(luò)安全相關(guān)的咨詢和教育,還能夠模擬真實(shí)的網(wǎng)絡(luò)安全攻防演練,幫助用戶更好地理解網(wǎng)絡(luò)安全。據(jù)說(shuō)"周鴻祎數(shù)字人"大屏+數(shù)字人+知識(shí)庫(kù)下來(lái)要10多萬(wàn)元,還是略貴。

相比2D名人數(shù)字人,不少3D數(shù)字人互動(dòng)能力更強(qiáng)。

WAIC見(jiàn)到的數(shù)字人“關(guān)小芳”,不僅可以跟用戶對(duì)話,還能識(shí)別你的表情,看到的衣著,判斷你的胖瘦。情商也非常之高,對(duì)話回答很有藝術(shù),譬如如果你很胖,你問(wèn)她自己胖不胖,她就說(shuō)你衣服挺寬松,很健康有活力。

硅基智能發(fā)布能夠通過(guò)文字預(yù)測(cè)表情的AIGC數(shù)字人產(chǎn)品“EMOTE-X”,在視頻演示中近一分鐘的時(shí)間里,數(shù)字人可以連續(xù)變換生氣、困惑、憤怒、輕蔑、恐懼、喜悅、痛苦、悲傷、期待、焦慮、興奮和驚訝12種情緒。

WAIC上互聯(lián)網(wǎng)大廠推出的數(shù)字人,則在各自擅長(zhǎng)領(lǐng)域發(fā)力。

比如,百度推出的數(shù)字人“度曉曉”,不僅能夠進(jìn)行流暢的對(duì)話,還能理解和生成圖像,多模態(tài)能力可使其在營(yíng)銷等領(lǐng)域拓展。

阿里巴巴的數(shù)字人“云小蜜”在電商服務(wù)領(lǐng)域展現(xiàn)應(yīng)用潛力。云小蜜能夠根據(jù)用戶的購(gòu)物習(xí)慣和偏好,提供個(gè)性化的購(gòu)物建議和售后服務(wù)。

騰訊的數(shù)字人“夢(mèng)幻精靈”則在娛樂(lè)和媒體領(lǐng)域的應(yīng)用。夢(mèng)幻精靈不僅能夠作為虛擬偶像進(jìn)行表演,還能在新聞播報(bào)和在線教育中提供生動(dòng)有趣的內(nèi)容。

字節(jié)跳動(dòng)的數(shù)字人“字節(jié)小靈”在內(nèi)容創(chuàng)作和分發(fā)方面展現(xiàn)了其創(chuàng)新能力。字節(jié)小靈能夠根據(jù)用戶的興趣和行為,生成和推薦個(gè)性化的內(nèi)容,為用戶帶來(lái)提供信息流服務(wù)。

由于當(dāng)下具有情商和智商的數(shù)字人更多,意味著公司前臺(tái)、景區(qū)接待、網(wǎng)站營(yíng)銷、會(huì)議主持等諸多場(chǎng)景,互動(dòng)數(shù)字人都有了用武之地。

8大鎮(zhèn)館之寶也頗具關(guān)注度

這屆AI盛會(huì)的特別之處,還公布了這八大鎮(zhèn)館之寶,官方營(yíng)銷還是客觀評(píng)比到不用過(guò)多糾結(jié),觀覽下這些創(chuàng)新產(chǎn)品,也是趣事之一。

這“八大鎮(zhèn)館之寶”分別是阿里云AI編程助手通義靈碼; 聯(lián)想集團(tuán)YOGA Book 9i AI元啟全尺寸雙屏筆記本電腦;螞蟻集團(tuán)基于螞蟻百靈大模型的“支付寶智能助理”;商湯科技首個(gè)面向C端用戶的可控人物視頻生成大模型Vimi;特斯拉賽博越野旅行車;智譜AI基座大模型;智能飛行器展區(qū)的電動(dòng)垂直起降航空器(eVTOL)和金融界AI電報(bào)。

這其中,AI代碼助手,被認(rèn)為是大模型商業(yè)化前景較明顯的一幕。

AI代碼助手“通義靈碼”,就是一款基于阿里云通義代碼大模型打造的智能編碼助手,提供行級(jí)/函數(shù)級(jí)實(shí)時(shí)續(xù)寫、自然語(yǔ)言生成代碼、單元測(cè)試生成等能力。該工具在中國(guó)信通院可信AI代碼大模型首輪評(píng)估中獲最高級(jí),目前插件下載量已達(dá)350萬(wàn),每日推薦代碼超3000萬(wàn)次,被開(kāi)發(fā)者采納的代碼行數(shù)超過(guò)億行。

AI視頻領(lǐng)域的現(xiàn)狀是:“Sora 不出,可靈誰(shuí)與爭(zhēng)鋒!

商湯馬上表示了不服,2024年7月4日,商湯科技宣布推出其突破性的人工智能產(chǎn)品——商湯Vimi可控人物視頻生成大模型。Vimi可控人物視頻生成大模型可用于影視制作、廣告創(chuàng)意、虛擬主播等領(lǐng)域,能節(jié)省視頻制作成本和時(shí)間。

Vimi能精準(zhǔn)的人物表情控制,穩(wěn)定生成長(zhǎng)達(dá)1分鐘的單鏡頭人物類視頻。而可靈支持生成時(shí)長(zhǎng)高達(dá)2分鐘的超長(zhǎng)視頻(幀率30fps),分辨率高達(dá)1080p,且支持多種寬高比。

看似可靈更強(qiáng),但Vimi是這屆活動(dòng)上發(fā)布,被評(píng)為本屆WAIC鎮(zhèn)館之寶也沒(méi)毛病。

AI PC也是最近的一個(gè)熱點(diǎn),微軟在Surface上的失敗耿耿于懷,大模型讓微軟找到了超越蘋果的機(jī)會(huì)。

國(guó)內(nèi)企業(yè)聯(lián)想也高舉AI PC的旗幟。聯(lián)想YOGA Book9i AI作為其首代AI PC,擁有可翻轉(zhuǎn)雙OLED屏和32G+1T的儲(chǔ)存,同時(shí)內(nèi)嵌了基于個(gè)人大模型、自然交互的個(gè)人智能體“聯(lián)想小天”,由嵌入本地的天禧大模型所驅(qū)動(dòng),除了常規(guī)的AI智會(huì)、AI演講、AI寫作、AI繪畫等應(yīng)用,還讓電腦融合了多種深度學(xué)習(xí)預(yù)訓(xùn)練模型和強(qiáng)化學(xué)習(xí)框架,使電腦具備更多AI 能力。

但這款A(yù)I PC 售價(jià)較高,達(dá)到了17999人民幣,且不適合對(duì)電腦配置需求較高的學(xué)習(xí)工作。

最后值得關(guān)注的是電動(dòng)垂直起降(Electric Vertical Takeoff and Landing,簡(jiǎn)稱eVTOL),御風(fēng)未來(lái)、時(shí)的科技、峰飛航空科技——這三家電動(dòng)垂直起降航空器(eVTOL)頭部企業(yè)的創(chuàng)新產(chǎn)品。

以盛世龍為例,這是峰飛航空科技發(fā)布的大型eVTOL載人航空器,5座設(shè)計(jì),最大航程達(dá)到250公里,巡航速度超過(guò)200公里/小時(shí)。由于采用復(fù)合翼構(gòu)型,既可以像直升機(jī)一樣垂直起飛和著陸,也可以如固定翼飛機(jī)一樣水平巡航。

eVTOL普遍適用于短程空中交通、城市空中運(yùn)輸?shù)。但該領(lǐng)域目前沒(méi)有哪家企業(yè)上市,也沒(méi)有哪個(gè)城市開(kāi)放了低空飛行,展會(huì)上的明星eVTOL,走向市場(chǎng)還需要時(shí)間。

WAIC展會(huì)已經(jīng)結(jié)束,機(jī)器人被認(rèn)為5年內(nèi)走向大規(guī)模應(yīng)用,互動(dòng)型數(shù)字人預(yù)計(jì)將快速布局 ,更多形形色色的AI產(chǎn)品,你認(rèn)為哪些能規(guī)模落地?

本文來(lái)源:AI鯨選社

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部