是不是以為我又標(biāo)題黨了。
但是這玩意我覺(jué)得真的夠強(qiáng),在我實(shí)際工作中也已經(jīng)用上好幾天,所以,體驗(yàn)下來(lái),我是真的覺(jué)得對(duì)得這個(gè)史詩(shī)級(jí)名號(hào)。
這個(gè)神秘的AI繪圖的新模型,叫做,Nano Banana。
雖然現(xiàn)在還只能在LMArena盲測(cè)的時(shí)候隨機(jī)出現(xiàn),還沒(méi)有公司出來(lái)認(rèn)領(lǐng),但是大概率是Google家的,AI繪圖新模型。
往期模型測(cè)評(píng):
強(qiáng)到離譜。
因?yàn)樗纳鷪D一致性,實(shí)在很頂。
直接給你們上一個(gè)case。
左邊,是我的照片。
右邊,是我用Nano Banana生成的最新一期視頻封面的底圖。
而我的Prompt,就是我把我自己的照片,扔進(jìn)去,然后寫(xiě)了一段:“A man with the same facial features and appearance as the person in the reference image is facing the camera. One hand is making a gesture that forms the number "0," while the other hand is holding three colorful children's picture books. His expression is natural and engaged, with a lively and playful pose. The scene conveys a lighthearted and humorous atmosphere. The background is a simple indoor setting with soft natural lighting. Realistic photographic style, 4K resolution, high detail, shallow depth of field.”
你們可以看到,Nano Banana幾乎完全保留了我的面部特征和表情,連嘴角弧度都是一致的,只是變了動(dòng)作和手勢(shì)。
人物一致性堪稱完美。
而與它相對(duì)比,其他幾家的生成結(jié)果是這樣的。
我拼了一張圖,你們可以直觀對(duì)比一下。
最左邊是GPT-4o,幾個(gè)月前剛出來(lái)的時(shí)候,感覺(jué)還是挺好用的,但是人物一致性簡(jiǎn)直就是一坨,現(xiàn)在再一對(duì)比,這泛黃的濾鏡,真的可以直接打入冷宮了。
中間是Flux Kontext,跟我長(zhǎng)得,感覺(jué)完全不是一家人...emmmmm,而且把表情換成了憨笑,我也沒(méi)讓它換,它自作主張給我換了。
而最右邊即夢(mèng)的版本,使勁的方向干脆就錯(cuò)了,衣服上的圖標(biāo)什么的倒是保留的很好,人臉完全不對(duì)勁,手上的繪本也很奇怪。
對(duì)比下來(lái),Nano Banana完勝。
做封面這種場(chǎng)景,我其實(shí)就一個(gè)要求,長(zhǎng)得像我。
但這個(gè)要求,以現(xiàn)在很多AI目前的一致性水平,還是達(dá)不到。
而如今,用Nano Banana,基本上,roll一兩次就行了。
真的很爽。
不過(guò)現(xiàn)在這個(gè)Nano Banana,非常神秘。
它現(xiàn)在只出現(xiàn)在LMArena上。
如果對(duì)大模型評(píng)測(cè)比較了解的朋友可能會(huì)知道,這就是全球現(xiàn)在最主流的大模型競(jìng)技場(chǎng),
主要的評(píng)測(cè)形式,就是兩個(gè)模型匿名對(duì)戰(zhàn),用戶根據(jù)生成結(jié)果投票,網(wǎng)站再根據(jù)投票結(jié)果,用一系列算法來(lái)計(jì)算模型排行。
很多廠子的新模型,在正式放出來(lái)之前,也經(jīng)常會(huì)用一個(gè)特殊的代號(hào),扔到LMArena上去給用戶盲測(cè)一下,看看用戶那邊的最終效果。
而這次的Nano Banana,其實(shí)就是這么一個(gè)提前放出來(lái)的神秘模型,目前沒(méi)有任何公開(kāi)使用鏈接,但是在LMArena上做生圖評(píng)測(cè)的時(shí)候,會(huì)被隨機(jī)選中。
本來(lái)生圖這個(gè)江湖,是seedream、flux、gpt、google imagen這些模型在混戰(zhàn)。
但有一天,大家測(cè)評(píng)的時(shí)候突然發(fā)現(xiàn),臥槽,怎么有個(gè)從來(lái)沒(méi)聽(tīng)過(guò)的Banana混入其中?
甚至,這個(gè)Nano Banana在已有的生圖模型里都找不到,只有在隨機(jī)測(cè)評(píng)時(shí)才會(huì)出現(xiàn),偷感超重。。。
然后大家又發(fā)現(xiàn),臥槽,怎么這個(gè)Banana,效果還挺好的。。。
而且,人物一致性,近乎無(wú)敵。
于是,Nano Banana就在外網(wǎng)上火起來(lái)了。
大家奔走相告,一堆人在LMArena上瘋狂roll圖,就為用到Nano Banana做一些事,甚至有人,把紙片人變成3D手辦。
給手辦加個(gè)酷炫背景。
還做出了各種意想不到的夢(mèng)幻聯(lián)動(dòng)。
人物幾乎完美一樣。
也有人開(kāi)始搜索,這個(gè)之前在江湖上沒(méi)名沒(méi)姓的Nano Banana,到底師出何門。
然后發(fā)現(xiàn),這個(gè)模型好像是google家的。
Google目前還沒(méi)有出來(lái)認(rèn)領(lǐng)Nano Banana,但我只是套路了Nano Banana兩句,它就把自己的家底兒都交代了,在自己身上畫(huà)了個(gè)大大的Google DeepMind。
大家基于此推測(cè),Nano Banana應(yīng)該是谷歌即將推出的新模型,低調(diào)來(lái)LMArena遛一圈,測(cè)測(cè)實(shí)力。
就解釋了,為什么Nano Banana偷感超重,只在battle中出現(xiàn),還是隨機(jī)出現(xiàn)。。。
說(shuō)下怎么用。
先登錄LMArena網(wǎng)站:https://lmarena.ai/
然后選擇頂上的battle模式,其他的什么都不用管,直接輸入prompt和參考圖。
它就會(huì)隨機(jī)選擇兩個(gè)模型,給你生成兩張圖片。
但是它不會(huì)告訴你這倆模型都是什么,這時(shí)候,需要你去選擇哪張圖效果更好。
等你選完之后,它才會(huì)給你揭曉答案。
你會(huì)發(fā)現(xiàn),選中的模型,可能并不是Nano Banana,這就對(duì)了,因?yàn)槭敲y(cè)。。。
你也不知道啥時(shí)候會(huì)隨到他,但是效果又確實(shí)爆炸的好。
這種神龍見(jiàn)首不見(jiàn)尾的情況還挺折磨人的,有時(shí)候連測(cè)四五次,nano都不出來(lái)。
更不用說(shuō)過(guò)程中一直遭遇人機(jī)驗(yàn)證,還經(jīng)常報(bào)錯(cuò)。有人懂我測(cè)的有多崩潰嗎。。。
要不是看在它效果好的份上,我真的,早就不測(cè)了。。。求求了Google,啥時(shí)候上下AI Studio或者Gemini吧。
我自己大概跑了一天的時(shí)間,也給大家看看實(shí)際效果。
這次,我把Nano Banana、flux、gpt4o、即夢(mèng)都拉過(guò)來(lái)一起測(cè)。
測(cè)完的圖,直接拼在一起看效果,非常直觀。
第一個(gè)case,是單個(gè)主體一致性。
我給了幾個(gè)模型這樣一張?jiān)瓐D,然后讓圖中的女人直面鏡頭,伸出手來(lái)觸碰鏡頭,仿佛打破了第四面墻。
然后,各家模型的效果是這樣的。
左上Nano Banana,右上gpt4o,左下flux,右下是seedream。
這樣看,效果還是非常直觀的。
Nano Banana主體保持的很好,妝容、服飾、頭飾都和原圖一樣。并且也做到了我提示詞上的內(nèi)容。
flux和seedream,主體還算大差不差,但是動(dòng)作都有點(diǎn)別扭。
gpt主體性保持的最差,還非常固執(zhí)地用著自己的比例和泛黃濾鏡。。。
第一題,Nano Banana勝。
然后是多主體測(cè)試。
我用了一張很經(jīng)典的電影海報(bào)《羅馬假日》,提示詞是,把男女主換成川普和馬斯克,電影名改為doge holiday。
左上Nano Banana,右上gpt4o,左下flux,右下是seedream。
最成功的,依然是Nano Banana。
gpt4o還是老毛病,泛黃,馬斯克的臉也沒(méi)那么像。
flux更離譜,直接干出來(lái)一對(duì)并不怎么像馬斯克的雙胞胎。
不過(guò)這道題對(duì)seedream有點(diǎn)不公平,因?yàn)樗鼰o(wú)法生成川普的形象,最終只能用一個(gè)金發(fā)老頭來(lái)替代。而且忘了給我生成馬斯克。。。
第二題,還是Nano Banana贏了。
第三個(gè)case,是背景替換能力,我用了一張我在漫展上拍到的很酷的機(jī)甲。
提示詞如下:
Replace the background with a cinematic post-apocalyptic ruin. The scene should feature destroyed buildings, rubble, and a dark, dramatic atmosphere. Behind the character, a massive explosion with fiery glow and billowing black smoke rises, creating intense tension and a sense of chaos. The overall look should be highly detailed, with realistic textures, strong contrast, and a cinematic color grade. Photorealistic style, 4K resolution, high detail.
一樣的順序,左上Nano Banana,右上gpt4o,左下flux,右下seedream3.0。
背景生成效果最好的,還是Nano Banana。
隨著爆炸發(fā)生,主體也被爆炸產(chǎn)生的強(qiáng)光照亮了,光影的真實(shí)感更強(qiáng),整個(gè)畫(huà)面對(duì)比更強(qiáng)烈。后面的廢墟大樓也有更多細(xì)節(jié)。
flux和gpt的背景就有點(diǎn)糊成一團(tuán),比較草率。
seedream背景也有點(diǎn)草率,最好玩的是,居然還莫名其妙增加了一個(gè)蹲在地上的程序猿= =
Nano Banana,再拿一局。
第四個(gè)case,是主體一致性+背景替換。
提示詞寫(xiě)了一大串,我就不貼了,大意是,把這個(gè)手辦放進(jìn)盒子里。
還是和之前一樣的順序。
這張圖乍一看,只有g(shù)pt需要被叉出去。
但仔細(xì)一看,flux悄悄魔改了眉眼和表情,讓本來(lái)元?dú)鉂M滿的小手辦顯得不是很有精神。
seedream這次能和Nano Banana打個(gè)平手。
再看看動(dòng)作遷移能力,沒(méi)有特別趁手的圖,我就用了雞你太美的表情包和一張我已經(jīng)用到包漿的照片。
因?yàn)榧磯?mèng)不支持多圖參考,所以這一輪只有三個(gè)選手參與測(cè)評(píng)。
從左到右,Nano Banana,gpt,flux。
Nano Banana還是最強(qiáng),主體和動(dòng)作保持的都很好。
但我真想把中間的gpt叉出去,看著就火大,有病。。。
下面一個(gè),測(cè)的是人物情緒。
我用了一對(duì)酷哥酷姐,幾個(gè)場(chǎng)景分別是:高興、生氣、一個(gè)人嘲笑另一個(gè)人。
這是兩個(gè)人在笑。
這是他倆發(fā)火了。
這是男的吃了哈利波特怪味豆里鼻屎味的豆子,女的在笑話他。
一整個(gè)看下來(lái),最強(qiáng)的還是Nano Banana,無(wú)論做什么大表情,人物都不會(huì)崩。
不是,這個(gè)人物一致性和動(dòng)作的遵循,實(shí)在是太特么牛逼了。倒數(shù)第二個(gè),是細(xì)節(jié)修改能力。
底圖是這張報(bào)紙,提示詞是,把中間的skor四個(gè)字母換成kazi。
只有Nano Banana完全遵守了指令,只改了中間四個(gè)字母,其他的沒(méi)增也沒(méi)刪。
最后一個(gè)case,是風(fēng)格轉(zhuǎn)換。
原圖在此。
我分別做了賽博朋克風(fēng)格,梵高風(fēng)格,還有水墨畫(huà)風(fēng)格。
賽博朋克這張,Nano Banana的完成度是最高的,無(wú)論是畫(huà)面的精細(xì)程度,還是人物的一致性保持,都拉開(kāi)很大一截差距。
梵高風(fēng)格的這一張,也是Nano Banana筆觸更細(xì)膩,人物更一致。
水墨畫(huà)風(fēng)格,結(jié)論還是一樣的,Nano Banana,真的很強(qiáng)。。。
以上,就是全部的測(cè)評(píng)。
從生圖效果來(lái)看,Nano Banana,完勝。
seedream和flux,一次直出的效果不如Nano Banana,但是整體質(zhì)量還可以,就是需要多抽點(diǎn)卡。
gpt4o,我實(shí)在是不想評(píng)價(jià)它。。。
而看完Nano Banana的測(cè)評(píng),你們應(yīng)該也就知道,怎么只用一張照片+Nano Banana,就做出N個(gè)動(dòng)作的真人視頻封面了。
答案就是,帶著你自己想要當(dāng)封面的個(gè)人照片,和你希望的提示詞:表情,動(dòng)作,背景,直接去LMArena上,開(kāi)battle模式生圖。
生成出來(lái)之后,憑直覺(jué)選擇你覺(jué)得更好的那一張,不用懷疑,大部分情況下,你覺(jué)得最完美的那一個(gè),大概率就是Nano Banana生成的。
然后把圖片下載下來(lái)就完活兒了。
沒(méi)有用過(guò)Nano Banana的朋友們,我真的勸你們,趕快去用,快點(diǎn)。
另外,實(shí)在是感嘆一句,Google真的還是太全面了。
感覺(jué)現(xiàn)在的Google,真的是多點(diǎn)開(kāi)花,全面領(lǐng)先。
底蘊(yùn)太厚了,太牛逼了。
目前的一致性之王,當(dāng)之無(wú)愧的屬于Nano Banana。
不知道下一次,這頂桂冠。
會(huì)花落誰(shuí)家?
歡迎關(guān)注作者的微信公眾號(hào):數(shù)字生命卡茲克
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國(guó)內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
AI輔助海報(bào)設(shè)計(jì)101例
已累計(jì)誕生 752 位幸運(yùn)星
發(fā)表評(píng)論 為下方 16 條評(píng)論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評(píng) ↓