机器之心最新报道
编辑:大盘鸡、杜伟
最近AI圈哪个模型最火爆?非OpenAI的GPT-4o莫属。
吉卜力风格的图片和视频在社交媒体上刷屏,网友们玩出了各种花样。我们用GPT-4o和可灵制作的吉卜力版《甄嬛传》,全网播放量已经突破20万次。除了口型和表情还有点小瑕疵,人物形象还原度简直绝了。
X平台上有大神用GPT-4o搭配Luma Ray 2,连《疯狂的麦克斯》的动画版都给整出来了。
视频链接:https://mp.weixin.qq.com/s/B728Ff5JykKwoTjQtzsEnQ
就在大家沉迷AI动画创作时,还有个隐藏功能被挖出来了——虽然OpenAI发布会上压根没提,但这个"画笔编辑"功能真心实用。
视频链接:https://mp.weixin.qq.com/s/B728Ff5JykKwoTjQtzsEnQ
没错,随手一涂就能当"造物主",想改哪里改哪里!我们马上试了试,效果确实给力。
把同事照片转成吉卜力风格后,点开图片右上角的画笔按钮就能进入编辑界面。涂掉想修改的部分,再输入指令,比如我们试了"去掉外套只留短袖"。唰的一下,穿着短袖的新图就生成了,原图的细节基本都保留着。
不过新旧图片还是有点区别,背景里的石头、植物摆放和人物表情都有变化。但整体效果不错,GPT-4o确实能懂我们的意思。
换背景也超简单,这张就把背景改成了小溪边。拿同事童年照试试,加个海盗帽也是分分钟的事。
当然复杂点的修改还有进步空间。比如这个弥补《大话西游》遗憾的换脸作品,至尊宝的金箍都快把猴子脑袋勒爆了,云雾特效也没覆盖全身。不过人物风格倒是保持得很完整。
推理功能暗藏玄机?GPT-5要来了?
除了玩转图片,GPT-4o还有个意外发现:现在能显示推理时间和思考过程了!这让人不禁猜测:OpenAI是不是在合并推理和非推理模型?就像奥特曼上个月说的,他们打算把o系列和GPT系列整合成能自动判断任务需求的智能系统,不用每次都手动选模型。
有网友晒出去年年底的截图,说明OpenAI可能早就在测试了,GPT-4o的推理能力至少打磨了半年多。
两位用户讨论得很热烈:一个说现在的推理比去年更详细,另一个指出这展示了OpenAI输出推理的进化过程,最近非推理模型里也开始出现推理功能了。
这种情况越来越多,不过也有人怀疑是不是系统bug。但就算是bug,也是个有意思的bug!就像这位网友说的:我们可能正在见证GPT-5的诞生,不同版本模型之间的界限正在快速消失。
© THE END
正如下面这位网友所说,看起来我们正在实时观察 GPT-5 的启动,模型版本之间的界限正在迅速模糊并合并。
© THE END