首頁 > 科技要聞 > 科技> 正文

魔改「黑神話悟空」,打敗Midjourney,這個(gè)AI生圖神器讓人上頭

appso 整合編輯:太平洋科技 發(fā)布于:2024-08-27 16:35

當(dāng) AI 文生圖比拼真實(shí)度、藝術(shù)感,Ideogram 開辟了一個(gè)刁鉆的賽道:在圖片上精準(zhǔn)生成文字,并且字體和排版都好看。

這個(gè)需求并不小眾,一鍵生成海報(bào)、插畫,還不用 P 圖,能夠省不少事,很適合對(duì)設(shè)計(jì)一竅不通的普通人。

。8 月 21 日,2.0 版本來了,真實(shí)感更好了,海報(bào)更有設(shè)計(jì)感了,文字這個(gè)看家本領(lǐng)也更強(qiáng)了。

你或許從來沒有聽說過它,這是一款前 Google 員工開發(fā)的 AI 產(chǎn)品,缺點(diǎn)不少,但長板能「彎道超車」Midjourney。

指路https://ideogram.ai/

AI 想知道,你說的悟空,是哪個(gè)悟空

Ideogram 有個(gè)特別新手友好的功能:「魔法提示」。

你直接輸入中文提示詞,它會(huì)幫你翻譯成英文,同時(shí)幫你優(yōu)化。作為一款海外產(chǎn)品,這樣的操作很能收買人心。

同時(shí),Ideogram 主打五種風(fēng)格:普通、寫實(shí)、設(shè)計(jì)、3D、動(dòng)漫,都很好理解,所以選擇起來也不會(huì)讓人糾結(jié)。

先來個(gè)簡單的中文提示詞,「拿著金箍棒的孫悟空」,動(dòng)漫風(fēng)格,讓 AI 幫我翻譯和優(yōu)化,看看它能自由發(fā)揮成什么模樣。

當(dāng)水靈靈的《七龍珠》版悟空出來的時(shí)候,我驚了一下,一看提示詞,AI 把孫悟空翻譯成了「Son Goku」,那就不奇怪了。

而且,也很想問問 Ideogram,是不是太明目張膽,給版權(quán)費(fèi)了么。

為了避免 AI 再誤解,再輸入提示詞的時(shí)候,我不偷懶了,強(qiáng)調(diào)「孫悟空」是「Sun Wukong」,不是「Son Goku」。

這次走寫實(shí)風(fēng)格,并且規(guī)定了比較詳細(xì)的場景,大圣身穿鎧甲,手拿金箍棒,神情肅穆,威風(fēng)凜凜,站在佛窟前,溫暖的橙色調(diào),圖片底部寫著「Black Myth: Wukong」(黑神話:悟空)。

文字沒有錯(cuò)誤,大寫字母沖擊感強(qiáng),佛窟的氛圍也營造了三分,但「大圣」的氣質(zhì)差了點(diǎn)、形象返祖了點(diǎn),眼神里也沒有光。

用相同的提示詞讓 Midjourney 生成一次,文字既有錯(cuò)誤又沒設(shè)計(jì)感,但稍帥一籌的「大圣」和頁游的畫風(fēng)彌補(bǔ)了這一點(diǎn)。

Midjourney生成

不甘心的我又試了 3D 風(fēng)格,提示詞基本保持不變,只是把底部的文字改成了「8 月 20 日游戲上線」。

結(jié)果,Ideogram 生成的結(jié)果很像某個(gè)國風(fēng) Q 版盲盒系列的宣傳圖,畫面處理得很干凈,但完全不是我腦海里的 3D 游戲風(fēng)格,還把美猴王畫出了二郎神的模樣。

并且 AI 也從中暴露了自己,雖然它對(duì)英文的文字渲染得心應(yīng)手,卻對(duì)中文一竅不通,這個(gè)缺陷從 1.0 延續(xù)到了 2.0。

看來海外產(chǎn)品不夠理解國內(nèi)的傳統(tǒng)文化,Ideogram 第一回合的表現(xiàn)有些令人失望,卻也不失趣味。

Ideogram 團(tuán)隊(duì)說過,2.0 版本不輸 Flux 和 DallE。最近,F(xiàn)lux 真實(shí)版 LoRA 生成的 TED演講照片因?yàn)檎婕匐y辨,騙過了不少網(wǎng)友的眼睛。那么就來測測,Ideogram 生成的結(jié)果能多像照片。

Flux生成

選擇寫實(shí)風(fēng)格后,我輸入了中文提示詞,TED 演講照片,幻燈片標(biāo)題為「Ideogram 2.0發(fā)布」,上面有三個(gè)要點(diǎn):「文字準(zhǔn)確」「擅長設(shè)計(jì)」和「更真實(shí)」,女性演講者站在白板前,背景中有幾個(gè)人。

可以看出,Ideogram 的語義理解是不錯(cuò)的,該有的元素都有,TED 的標(biāo)志幾乎以假亂真,演講者和觀眾的表情都很生動(dòng),頭發(fā)和皮膚比較自然。

不過,細(xì)節(jié)處理得還不夠好,雖然要求生成的文字沒有問題,隨機(jī)出現(xiàn)的一些小字壞了一鍋粥,人物的手指和身體也不太對(duì)勁,但已經(jīng)比之前的 1.0 版本強(qiáng)太多了。

至于海報(bào)設(shè)計(jì),可以說是 Ideogram 吊打其他文生圖 AI 的「舒適區(qū)」了。

如果以票房異;鸨摹懂愋危簥Z命艦》為考題,AI 能設(shè)計(jì)出那種不可名狀的恐怖感覺嗎?

我選擇了設(shè)計(jì)風(fēng)格,用提示詞描述了一下畫面的要素,并特別提及,海報(bào)底部寫上一句:「未成年觀眾謹(jǐn)慎觀看!

總體的效果讓人眼前一亮,長串的文字也成功生成了,只有一處小錯(cuò)誤,但特別不寫實(shí),更像美漫的畫風(fēng),和真人電影不太相配。

我再以暑期檔爛片《紅樓夢(mèng)之金玉良緣》為靈感,讓 Ideogram 生成海報(bào),提示詞寫到的背景、裝飾物乃至人物都在其中了,再次感嘆提示詞的跟隨性真的不錯(cuò)。

片名當(dāng)然也寫對(duì)了,但字體像借鑒了指環(huán)王,有些出戲,整體風(fēng)格更像花木蘭動(dòng)畫電影。

Ideogram 的「設(shè)計(jì)風(fēng)格」偏向二次元,比較獨(dú)特,但反過來想,這也局限了海報(bào)的使用場景。

小結(jié)一下,Ideogram 是一款很有自己特色的 AI 文生圖產(chǎn)品,寫實(shí)的水平和 Flux 相近,藝術(shù)感和 Midjourney 各有千秋。

「rainy summer」圖案

但文字生成水平獨(dú)一檔,比較適合用來生成海報(bào)、插畫、廣告、表情包、T 恤印花等。

人類評(píng)估的結(jié)果顯示,Ideogram 2.0 在提示詞對(duì)齊、整體表現(xiàn)和文本渲染質(zhì)量方面,都比 Flux Pro 和 DALL·E 3 更好。

但這是 Ideogram 自己的說法

可玩性高又接地氣,這樣的 AI「甜品」不妨多來一些

去年 8 月 22 日,Ideogram 宣布成立,與 2.0 發(fā)布正好相隔一年。

創(chuàng)始團(tuán)隊(duì)共 7 人,來自 Google Brain、加州大學(xué)伯克利分校、卡內(nèi)基梅隆大學(xué)和多倫多大學(xué),其中 4 位是 Google 文生圖擴(kuò)散模型 Imagen 研究論文的作者。

這次除了發(fā)布 2.0,Ideogram 還推出了 iOS app,國內(nèi)可以直接下載,Android 版計(jì)劃稍晚發(fā)布,從網(wǎng)頁到移動(dòng)端,我們可以隨時(shí)隨地生成圖片了。

手機(jī)端界面

Ideogram 目前向所有用戶免費(fèi)開放,不過,額度非常有限,生成 5 次共 20 張照片后,Ideogram 就提醒我,10 個(gè)積分用完了,請(qǐng)明天再來。(當(dāng)然,隔壁的 Midjourney 免費(fèi)生成 25 張也沒有顯得多大氣。)

如果很少接觸文生圖,想要一款文生圖 AI 用來入門的,Ideogram 是個(gè)不錯(cuò)的選擇。

輸入中文提示詞、用「魔法提示」翻譯和優(yōu)化是一方面,另外,Ideogram 還有很多選項(xiàng)幫你生成更接近腦海所想的畫面。

提供范圍有限的選項(xiàng)讓用戶「點(diǎn)擊」,相比在空白的輸入框完成「輸入」,交互起來更簡單。想要什么圖片比例、什么風(fēng)格、什么色調(diào),Ideogram 都可以讓你挑選。

不同色調(diào)的「戴珍珠耳環(huán)的少女吃麥當(dāng)勞」

不會(huì)寫提示詞,那也可以畫出來,讓 Ideogram 幫我們化腐朽為神奇。

我為我的糟糕畫工感到抱歉,但 AI 能夠領(lǐng)會(huì)意思,優(yōu)化了線條和上色,還加了個(gè)背景,格調(diào)一下子上去了。有了 AI,誰不是神筆馬良。

另外,網(wǎng)頁版的輸入框下面,都是他人生成的作品,遇到喜歡的,我們可以查看和參考提示詞。Ideogram 表示,他們的用戶在過去一年生成了超過 10 億張公開可見的圖片。

如果想要生成一個(gè)特定的對(duì)象,但又不知道怎么寫提示詞,Ideogram 這次還推出了用文本搜索公共創(chuàng)作庫的功能,但這個(gè)功能目前需要會(huì)員。

搜索「cat」的結(jié)果

總而言之,Ideogram 是一款可玩性較強(qiáng)的文生圖產(chǎn)品。

它可以比較精準(zhǔn)地生成用戶所需的文字內(nèi)容,并適配各種風(fēng)格的圖片,就業(yè)領(lǐng)域很廣。

圖源:Ideogram 博客

偶爾還能帶來情緒價(jià)值,以圖言志,雖然做的表情包太偏歐美互聯(lián)網(wǎng)的審美了。

「我想玩《黑神話:悟空》」表情包

Ideogram 的整體質(zhì)量不差,文本功能強(qiáng)大,對(duì)新手友好,使用方便,交互也讓人愉悅。當(dāng) AI 工具兼具了創(chuàng)意、便利和分享價(jià)值,就很容易讓人上頭。

一個(gè)照著模子刻出來的世界太無聊了,洞察到很小的需求,然后將解決辦法做到行業(yè)第一,那也很有意思。

世界上有很多的產(chǎn)品,同時(shí)有更多的受眾,我們可以期待更多這樣的 AI「甜品」

本文來源:Appso

appso

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部