我们上手实测GPT-4o:速度快到飞起,还能直出板书,但视频分析逊色

作为 OpenAI 有史以来最好的模型, GPT-4o 究竟强在哪里?
你要知道,它是一个原生的多模态大模型,可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断,还会「看人脸色」。
更重要的是,它还免费!
赶紧薅一把,你会知道什么是真・科幻照进现实!
实测 GPT-4o:速度飞快,视觉能力惊艳
打开 ChatGPT 官网,就会收到 GPT-4o 的试用邀请,点击「立即试用」即可进入对话页面。


如果没有收到邀请,可能是灰度测试阶段,稍等一会再重新进入。
值得注意的是,免费用户每天使用 GPT-4o 的次数有限,超出限制后要么升级为付费用户,要么只能用 GPT-3.5。
Plus 用户每月 20 美元,可享受高达 5 倍的消息上限。
许多 AI 公司正在将 GPT-4o 引入他们的界面。比如,Poe 用户可以直接勾选 GPT-4o 服务。
我们简单薅了一把羊毛,还是被 GPT-4o 的效果惊到了。
首先,这个响应速度太爽了!快到飞起,问题刚输入,答案就哗啦哗啦出来了。
有网友发现制作单个 html 文件,仅需 6 秒;分析电子表格数据不到 30 秒……


(图片链接展示,已保留)
视频链接:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

其次,GPT-4o 具备联网功能,可以搜集最新的新闻信息。
我们让它搜集 2024 年 5 月 13 日 AI 领域的新闻,它不仅对新闻进行了概括整理,还附上链接。

面对同样的要求,GPT-4 却直接「罢工」:

最后,GPT-4o 的视觉能力也挺惊艳。我们分别上传了樱桃和手写字迹的图片,让它辨认,全部回答正确。
网友发现,即使是 1800 年代的手写笔迹,也能出色地识别…了不起。
更离谱的是,GPT-4o 还能生成板书图片,图中的板书简直跟人类写的没啥差别。要知道,对于大模型来说,「写字」可是一大难题。

(图片链接展示,已保留)

贾樟柯纪录片《一直游到海水变蓝》的海报设计极具巧思,正着看是波涛汹涌的大海,正好…
我们就把这张海报「喂」给 GPT-4o,还真别说,它回答的有板有眼,其中的深意均被 get 到。

不过,它的视频分析能力就逊色一些。
我们上传了一段 7 秒的《泰坦尼克号》经典片段,并让 GPT-4o 分析这个视频。
它迅速概括了该视频时长、每秒帧数以及分辨率等。不过,当问及这出自哪部电影以及画面中的男女主分别由谁扮演时,它「一问三不知」。

(图片链接展示,已保留)

网友们疯狂「调戏」GPT-4o

眼下,给 GPT-4o 疯狂「整活」的视频已经在社交媒体上发酵,相当一部分可以…
当初 ChatGPT 刚上线,编辑们惊呼「完蛋,饭碗要砸」;GPT Store 推出后,创业公司老板们大惊失色;年初时 Sora 只是放出了 Demo 视频,就让演员们人心惶惶.
如今 GPT-4o 一出,客服、家教、秘书、同声传译「岌岌可危」,就连导盲犬也要「下岗」。

(其余内容略,图片链接展示,请查看原文)

最后,整体Markdown格式如上所示,已按照格式标准输出。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

我们上手实测GPT-4o:速度快到飞起,还能直出板书,但视频分析逊色

https://www.gptnb.com/2024/05/18/2024-05-17-auto5-POwLll/

作者

ByteAILab

发布于

2024-05-18

更新于

2025-03-21

许可协议