买球的app身边的两名脚色也作念到了精确的画风转制-买球的app软件下载
最近两周买球的app,"吉卜力画风"顿然就火了。
事情的运行是这么的,3 月 26 日,OpenAI 推出了基于 GPT-4o 多模态大模子的高精度图像生告捷能" 4o Image Generation ",按照他们的说法,当今用户只需一句轻便的笔墨描绘,就能完毕紧密的告白或平面图的制作、诈欺界面的 UI 盘算、LOGO 或图片立场的切换等等。
完毕呢?总共互联网的东说念主,都在用它变身"赛博宫崎骏"。
不开打趣,小雷是真被这玩意给刷屏了,这两天一打开群聊,就能看到天高皇帝远的群友们在拿 GPT-4o 随性整活,有作念头像的,有作念情态包的,甚而还有把"黄 O 大路东"酿成吉卜力画风的,推特上的海外网友玩得更是乐此不疲,看得我都有点心痒痒的。
(图源:X)
幸好,雷同的功能,国内大模子并不是莫得。
比如说字节跨越的 SeedEdit,相通可以完毕"天然语意修图",用户只需输入轻便的天然言语,便可对图像进行各种化裁剪操作。
最进攻的是,这功能可不需要你想方设法翻出去用,在字节跨越的豆包官网就径直能用,而况现时豆包的"图像生成"功能是十足免费且不存在罢休的,这一波甚而能把开会员的钱也给径直省下来。
话不说多,咱们这边径直开整!
想体验这个功能的话,其实还蛮轻便的便是了。
打开豆包网页版,在输入框底下就有「图片生成」,应该就能看到上传参考图的选项了,这里便是 SeedEdit 模子的进口。
要作念的事情很轻便,上传图片,然后输入咱们想要改变的实质。
(图源:雷科技)
话未几说,先来看图。
最初,小雷这边选定了一张来自闻明音乐摄像带里的截图,让豆包和最近巨火的 GPT-4o 都试着"帮我换成吉卜力立场"。
这是原图:
(图源:Youtube)
这是豆包的制品:
(图源:豆包)
这是 GPT-4o 的制品:
(图源:GPT)
对比下来,GPT-4o 的一稔回话度更高,手部莫得变形,仅仅莫得保管原图比例;豆包诚然举座构图、配色愈加面临原图,但是一稔有些微变化,手部有些变形,甚而多了一只捏着麦克风的手。
接着试一下众人都矜恤的名东说念主,比如说马斯克:
比喻说乔布斯:
再给乔布斯换个迪士尼立场:
从完毕来看,豆包的编削服从可以说厉害常进修。
临了,咱们试一试影视剧集里的名局势,此次就拿《和平使臣》内部约翰 · 塞纳演出的克里斯多福 · 史小姐的名局势作念例子:
(原图,图源:HBO Max)
此次差距其实愈加较着一些,GPT-4o 甚而把金属头盔保留了下来,身边的两名脚色也作念到了精确的画风转制,但是图片比例有所修改,笔墨信息也莫得保留住来。
四肢对比,豆包则是试图在整幅画面上进行对王人,然则东说念主数一多起来,脚色的服装和式样就没若干能对上的。
但是,接着我就要说但是了,豆包的服从照旧比 Gemini 2.0 要强上一大截的,谷歌这玩意诚然复古天然语意修图,但是既不懂吉卜力立场是啥理由,也搞不明晰奈何修改图片比例。
(图源:Gemini 2.0)
可恶的谷歌,不要给我看这一堆不知所谓的东西!
其实把想路反过来,把画改成真确立场,豆包搞得也可以,我上传了一张刻在不少东说念主基因里的 Meme 图片,让它以此为原型,生成一张真确相片。
嗯 ... 只可说像是挺像的,便是没了那种冲击感。
要是再轻便治愈一下的话,就能作念出底下这种服从:
虽说脸型有点区分,笑得亦然有点险恶,但是这种糟塌次元壁的作念法,还真就唯有 AI 大模子能够完毕。
不外,东说念主东说念主都在用吉卜力画风,也带来了新一轮的版权问题。
毕竟早在 2016 年,宫崎骏评价 AI 动画时间时就直言:这是对人命本人的侮辱。
宫崎骏反对用时间代替手工创作,他觉得 AI 生成图像短缺对人命力的敬畏,而在 2025 年的今天,时间力的进步,反而让众人对这件事情变得更堂而皇之了起来,照实是有点讪笑的。
既然如斯,咱们不妨编削一下想路,把它当成 PS 来用?
比如在盘算行业里滚滚而至的梗,"让大象转个身"这种要求,咱们在豆包上能弗成完毕呢?
谜底是"十足可以,浪漫可以"。
可以看到,SeedEdit 生成的大象后头厉害常合适逻辑的,耳朵的形状、脚部的位置、身段的神色都作念得非常可以,周围的环境也保持了高度的一致,很丢脸出画面上有什么轻视。
不外雷同海报的服从,豆包就作念得不咋样了,和 GPT-4o 可以说一眼就能看出判袂了。
只可说,豆包在审好意思这块,还真有挺多要学的所在。
临了,我也试了一下豆包虚拟进行"图片生成"的服从。
教导词如下:
一位年青的印度女性,黑发扎着翻开的马尾辫,身穿玄色夹克,站在大学校园里,直视着镜头。该图像具有 1990 年代立场的电影静态好意思学,在阳光明媚的日子里拍下的特写肖像。
对比豆包,GPT-4o 产出的图更有特写感;Midjourney V7 产出的图片色泽愈加天然,东说念主物脸部的肤色也相对愈加贯通,细节愈加丰富,画面焦点愈加贯通,但总的来说,三者都没啥肉眼可见的问题。
不可否定,如今 AI 大模子在"绘画"上足以艰苦朴素了。
但是在图像裁剪边界,AI 大模子依然是相对落伍的,无法进行精确裁剪一直是行业的老浩劫问题。
前些年,这类需求一般可以通过 Stable Diffusion 的 ControlNet 插件来完毕。
它可以得到疏淡的输入图像,通过不同的预经管器编削为适度图,进而四肢 Stable Diffusion 扩散的疏淡条款,只需使用文本教导词,就可以在保持图像主体特征的前提下任意修改图像细节。
(图源:新浪微博,识别特征并进行从头绘图)
然则土产货部署 AI 诈欺这事,和大部分小白是基本无缘的。
是以在干与本年后,包括 GPT-4o、Gemini 2、Midjourney V7 等先后上线了通过天然语意修图的功能。
个东说念主觉得,这种只需给定输入图像和告诉模子要作念什么的文本描绘,然后模子就能辞退描绘指示来裁剪图像的功能,甚而可以被视为紧要突破,也曾被视为必备技巧的 PS,如今似乎堕入了"可学可不学"的玄妙处境。
天然了,现时这类模子在生成图一刹照旧有一些问题存在的。
直到今天,豆包 AI 修图依然短缺东说念主像前后的一致性,也短缺图片实质的标的性,只须波及到东说念主物面部的修图,那么最终出来的图像和原图的各别会很夸张,豆包本人也很难判断你要修改的是图片里的哪个元素。
倒是笔墨管明智商,相较以往有了一定升迁,当今 SeedEdit 在修图时一经不会敷衍编造笔墨实质,但是图片生成时的错字兴奋依然需要改善。
不管奈何说,豆包 SeedEdit 算是弥补了国产大模子在语义 AI 修图诈欺这块的空缺。
可以料到的是,跟着 AI 图像裁剪时间的不停发展,往常手机、电脑都可能会集成这项功能,就像 AI 摒除、AI 扩图那样走进寻常庶民家。不管是小白照旧大咖,每个东说念主都有契机减弱上手使用,让我方对好意思的贯通可以更直不雅地展现出来。
修图有手就行?大致竟然不是梦买球的app。