首頁 > 科技要聞 > 科技> 正文

AI視頻新霸主誕生!Dream Machine官宣免費用,電影級大片全網(wǎng)玩瘋

新智元 整合編輯:太平洋科技 發(fā)布于:2024-06-19 16:43

視頻生成領(lǐng)域,又添一員猛將!

Luma AI首發(fā)了自己的視頻生成模型Dream Machine,可以通過文字或圖片生成高質(zhì)量的逼真視頻。

更重要的是,API對全球免費開放!進入官網(wǎng)后用谷歌賬號登錄即可馬上試用。

每個用戶每月有30次免費生成的額度,但比較遺憾的是,每條視頻時長只有5秒。

免費試用的消息一出,熱情的網(wǎng)友們紛紛擠入服務(wù)器,結(jié)果發(fā)現(xiàn)Luma AI囤的算力好像不夠,于是開始了一場漫長的等待。

剛發(fā)布后,有些人等了2個小時還沒生成出來,Reddit社區(qū)中一片怨聲載道。

果不其然最后「真香」了,這個視頻質(zhì)量是值得等一會兒的。

接下來,看看這個「造夢機」究竟有多瘋狂?

電影級畫質(zhì),逼真感拉滿

官方放出的demo涵蓋了各種不同風(fēng)格和題材的視頻,能感覺到最突出的特點就是「電影感」拉滿。

不僅有比較好的連貫性,鏡頭的藝術(shù)感也非常不錯。

此外,demo還單獨強調(diào)了一些模型能力,比如生成各種動態(tài)以及具有表現(xiàn)力的人物。

不得不說,Luma的審美真的在線,視頻中的小姐姐都有一種超模般的「高級美」。

下面這個黑白色調(diào)的仰拍鏡頭,人物動作自然絲滑、一氣呵成,裙擺飛起時的幅度雖然有些夸張,但還在可接受范圍內(nèi)。

最重要的是動作符合自然規(guī)律,沒有出現(xiàn)「手臂融化」、「膝蓋外折」這種神奇情況

下面這個demo可以讓日漫迷們淺淺興奮一下,不僅風(fēng)格對味兒,而且鏡頭很有意境,可以開始幻想「人均新海誠」了。

比官方demo更精彩的,是各路大神網(wǎng)友們的腦洞創(chuàng)意。

比如在人眼中嵌入一個手繪地球儀。

原本需要幾千個高斯點染圖的工作,一個Dream Machine就能瞬間完成了。

Sora發(fā)布時,很多人驚嘆于模型對于光影效果的理解,Dream Machine在這方面的表現(xiàn)也很不錯。

這位網(wǎng)友用自己拍攝一張的照片作為提示,生成出來的視頻可以延續(xù)之前的光感,絲毫不會割裂。

將世界名畫《帶珍珠耳環(huán)的少女》輸入給Dream Machine,就可以讓藝術(shù)史上這位著名模特瞬間「復(fù)活」。

但是模型似乎有它自己的想法和審美,比如視頻后半段自行更改了模特的相貌和頭巾材質(zhì),感覺從17世紀的荷蘭少女無縫銜接到21世紀T臺。

之前在視頻生成模型中很少見到的風(fēng)格,Luma也搞出來了。

比如下面這個demo,狠狠拿捏住了好萊塢老電影的感覺。

提示:意大利黑手黨家族站在桌子周圍,一邊抽雪茄一邊數(shù)黃金和金錢

但槽點也不是沒有,比如香煙的煙霧擴散似乎不夠自然,而且沒有遵守提示中的「站在桌子周圍」(可能是黑手黨老大只會坐著吧)。

親測史密斯吃面

看了這么多demo,有比較嚴謹?shù)腞eddit網(wǎng)友坐不住了。模型都放出來了,應(yīng)該跑下基準(zhǔn)測試吧——

哪個好心人幫忙生成下Will Smith吃面條?

「唯一的真實基準(zhǔn)測試!

已經(jīng)等不及的小編決定自己動手,成果如下——

沒想到Dream Machine雖然不太愛聽指令,但還挺有幽默感的。在其他模型中還沒見過因為吃不到面條氣成這樣的Will。

如果輸入更詳細的指令呢?

面條的形態(tài)也很自然,但手指似乎不太對勁,但更明顯的問題是,Will吃著吃著居然變臉了。

如果直接將這張圖片輸入給模型,能否解決變臉的問題呢?

很遺憾,似乎并沒有。

AI視頻三大王者PK

那么相比Pika、Sora等同行競品,Dream Machine的性能究竟是個什么水平?

有試用者大膽宣稱,Luma是目前我們見到最好的模型!

畢竟Sora還沒公開,沒有人能準(zhǔn)確評價其實力。但大家似乎都認同,Luma的表現(xiàn)要優(yōu)于Runway和Pika。

甚至還有Luma真愛粉在推特上直抒胸臆。通過輸入相同的提示對比Pika、Runway和Dream Machine三個模型,他認為最終還是Luma贏了。

從完整視頻中可以看到,三個模型都可以生成和渲染很高質(zhì)量的畫面。

但Luma模型之所以「電影感」更強,一方面是似乎有更豐富的「想象力」,能腦補出更多表情和動作;

另一方面則是源于更自然的鏡頭節(jié)奏,人物的行動速度適中,既不過快,也不過慢。

剛剛發(fā)布,網(wǎng)上似乎就充斥著對Dream Machine的溢美之詞,但這并不代表模型生成的視頻已經(jīng)完美無缺了。

Luma官網(wǎng)上就非常坦誠地放出了很多有缺陷的demo,表明他們今后計劃的改進方向。

比如剛才Will Smith吃面條的視頻中出現(xiàn)的「變形」,不僅人臉會有,跑車也會有。

更驚悚的是,在水中游泳的北極熊會突然從身后長出另一個頭。

此外,其他模型存在的問題,Dream Machine也沒能幸免,比如有時會生成錯誤的文字,或者沒能實現(xiàn)想要的動態(tài)效果。

而且小編在嘗試官方推薦的文本prompt時,還偶遇了模型的「精分」現(xiàn)場。

輸入下面這個prompt,可以得到官網(wǎng)同款的驚艷demo:

Low-angle shot of a majestic tiger prowling through a snowy landscape, leaving paw prints on the white blanket

一只雄壯的老虎在雪地中徘徊的低角度鏡頭,在白色的雪地上留下了爪印

但視頻后半段就突然畫風(fēng)一轉(zhuǎn),不僅虎爪的形態(tài)不自然了,變臉的程度甚至達到了「驚悚」級別。

雖然有諸多不足,但是Luma能在官網(wǎng)上坦然放出缺陷demo,并放出了一系列「未完待續(xù)」的動圖,暗示著下一步的更新很可能就在不久之后。

背后團隊,5位華人

發(fā)布模型的同時,Luma也公布了模型開發(fā)團隊的名單。從名字來看,14人中應(yīng)該有5名華人成員。

其中,Alex Yu是公司聯(lián)創(chuàng)兼CTO。他畢業(yè)于加州大學(xué)伯克利分校,曾在Adobe工作,研究方向是神經(jīng)渲染和實時圖形領(lǐng)域。

Yu在2021年畢業(yè)后,就和另一位創(chuàng)始人Amit Jain創(chuàng)辦了Luma公司。

Jain在學(xué)校修讀的是物理和數(shù)學(xué)學(xué)位,曾在蘋果工作,在3D計算機視覺、機器學(xué)習(xí)、系統(tǒng)工程和深度技術(shù)產(chǎn)品方面有豐富經(jīng)驗。

根據(jù)crunchbase的數(shù)據(jù),Luma AI已在 3 輪融資中籌集了6730 萬美元,最新一輪融資是今年1月9日通過的B輪融資,最新的投資方包括英偉達公司。

參考資料:

https://x.com/LumaLabsAI/status/1800921380034379951

https://www.reddit.com/r/singularity/comments/1decmby/maybe_this_thing_shines_with_an_input_image_here/

https://lumalabs.ai/dream-machine

本文來源:新智元

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部