今年可以说是,各种AI应用迸发的大元年了。 不管是ChatGPT,还是国内各种新生大模型,在日常问答、结合上下文理解等场景,都已做得相当成熟。 就连,集人类智慧语言大成的艺术——拍马屁。 AI都能出口成章,讲实话(吹牛)不带一点脸红的。 你说好玩么,固然是好玩的。 但文字的表现力,也终归是不如图片和视频的。 不管是普通网友,还是在捣鼓AIGC的工程师,都渴望能用上更先进成熟的AI生图、扩图等功能。 此前呢,也确实有好几个AI扩图的应用,陆续面世。 比如PhotoShop的【创成式填充】,能直接扩展出海边全景图。
又比如,机哥之前给大伙详细盘过的,美图秀秀【AI扩图】功能。
它们都很好,但唯独使用门槛上,有亿点点高。 要么是要用到电脑,要么是免费次数有限。
用到一半收费,带来的痛苦不亚于,洗澡突然断水... So,或许是意识到,网友们对于AI整活的强烈需求。 浓眉大眼的抖音,最近也搞起了【AI扩图】,还直接登上抖音热榜第一。 愿景十分美好: “AI扩图,一秒拯救废片。”
但大伙都懂的。 那稍显稚嫩、练习时长还不足两年半的【AI扩图】。 即使再怎么稳健,也难免会有翻车的时候。 在抖音的【AI扩图】板块里。 总是能出现一些,令人始料未及的扩图元素。 比如,这个“一人一狗”躺在床上的场景,满满的温馨。
那经过【AI扩图】处理后,画风一定也很温暖吧? 只见画面中,多出一个年轻貌美的欧美女生。 看来AI还是懂人类最朴实的需求——渴望陪伴。 而男主也确实,在这场景下华丽转身,成为了霸道总裁。
弥补遗憾、成全人类,无疑是AI造福人类的一大体现。 但有一个问题,机哥不知当讲不当讲。 咱就是说,这哥们儿的手,咋就剩下半截了?
如果说残忍“截肢”,还能说是【AI扩图】对场景识别出错所致。 辣么,把人下半身补全为“人马”,阁下又该如何解释呢?
这可不是,AI把人类“动物化”的孤例啊。 还有一位网友,特意选了一张打脸局部图,来考验AI的扩图准确度。
至于AI扩图的结果嘛。 机哥劝大伙做好心理准备,看了多少有点恐怖谷效应的... 原本好端端的一位帅哥,被AI直接扩成狗子了。 说它瞎搞吧,它精准保留了左上角的灯源。 说它正经吧,又给人类硬生生切换了物种。
反正,这种对着大脸自拍的,就特别容易翻车。 人类可能不会在同一个地方跌倒两次。 但依靠海量素材训练的AI,显然是会的。
这么看下来。 抖音的【AI扩图】,对人物肢体部位的还原,还是很抠脚。 运气好的话,确实能还原出正常的四肢。 但要是AI玩得奔放点,它绝对能给你整出一些,令人眼前一黑的狠活...
各种离谱的翻车,让机哥更加好奇。 处理时间短一些的【AI扩图】,效果就如此不堪么? 正所谓实践见真章。 我还是没忍住下了个剪映,试试这【限免】的扩图,到底是怎么个事儿。 像这类,直接面向广大用户开放的AI功能,使用起来都很简单。 在App里随便导入一张图片,点击【抖音玩法】,就能找到扩图功能。
初来乍到,机哥还是先挑了一张,难度没那么高的风景图。
而这,是经过抖音AI扩图后的效果。 我是主观觉得,效果一般般。 首先是整张照片的色调,在经过AI优化后,暗沉了许多。 而且这明明是个电线杆,被AI扩充后,反而成了...椰子树?
如果是食物图,会不会出现些离谱要素捏?
你别说,扩充得还行。 桌上多了一盆花,右边的食物多出的部分,也毫无违和感。 如此看来,这AI处理一些风景和事物,还是游刃有余滴~
可问题的关键还是在于,它到底能不能人给扩充好。 毕竟钢筋水泥和绿树青山啥的,咱们天天都能拍上。 但好的人像照片,却常常稀缺。
老规矩,咱们难度循序渐进,先用国外很火的“老外回头”梗图试水。
扩图后的效果其实还行,AI显然是识别到了图片有街道。 于是就顺着原有场景,补全了行人和店铺。 甚至连背景的景深虚化,都考虑进去了。
但机哥还是想说,这【AI扩图】只能看个整体氛围感。 要是像列文虎克那般细看,那基本没有一种图,是能经得起考验的。 比如这张图里的牛仔裤,就莫名其妙被缝合了红色布料,脚的形状也很奇怪。
接着再来一个,很经典的“思考的黑人”图。 扩图后,整体看下来没啥违和感,翻车的地方也有,但比前面的效果都好上不少。
测到这里,机哥算是摸清了抖音这个【AI扩图】的特性。 画面元素越简单,扩图效果就越好。 毕竟生成式AI嘛,最擅长的就是“无中生有”了。 但如果画面要素太杂,AI就会追求“啥都要”,导致照片出现与现实场景不符合的东西... 比方说,这张图里面的轮椅...
还有一个要点,千万不要只留半边脸给AI。 机哥亲测,半脸图基本试一次,翻车一次。 机友们也不想,自己的肤色被切换,脸部表情被扭曲吧?
不过话说回来。 AI扩图翻车的例子虽多,但不意味着,AI做不好这事儿。 机哥体验过很多“生成式AI”。 包括纯文本的、文生图的、图片扩展的和图片转视频的...
可以说,“生成式AI”都有一个很明显的特点: 你给它计算的时间越多,它反馈给你的成品,质量就越好。 但市面上的【AI扩图】功能,基本都面向大众用户的,对出图的速度追求,优于质量追求。 毕竟要是大伙等得太久,谁还乐意用啊。 而追求快呢,就难免会出现翻车,二者不可兼得。
但我觉得,现阶段的痛点,很快就要被更新的技术给解决掉。 更别说,现在的生成式AI,已经进入了—— 动动鼠标,就能让静态图动起来的全新阶段。
|
电话:647-830-8888|www.66.ca 多伦多六六网
GMT-5, 2025-12-26 07:31 PM , Processed in 0.052747 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.