实测 | GPT-o1:学会了思考,也学会了偷懒

文章来源:AI科技评论
原文链接:https://mp.weixin.qq.com/s/gZY1tLetXXvvzvW_NyZttw

我可能是全网第一个花钱向 GPT-o1 提问,人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最强大模型 GPT-o1 模型思考 38 秒之后、宕机了半小时选择拒绝回答问题并收了我2.5块(一瓶肥宅快乐水)的韭菜……

(因为这个模型只支持订阅使用并且一个月只回复120条内容,plus会员订阅费1个月20美刀,约等于1.25软妹币1条回答……)

OpenAI 今天凌晨突击更新 GPT-o1,早上起来全网都在开香槟,大意就是突破了LLM极限,新模型能力在生物、物理比肩甚至超越人类博士生。另一个特性就是 o1 模型会用更长的时间思考以此来尽可能完善的回答问题。


针对上面提到的两个特性,小编找了几个需要强综合逻辑思考能力并包含物理、生物、数学能力的题目来测试GPT-o1 的能力到底如何。以下是题目设置:

数学题测试

「人力显卡」所有人类都用笔算/心算产生的算力能否推翻英伟达的统治?
「钞票打印机」如果我的家用打印机能够打印美元,我能比马斯克有钱吗?

综合性物理题

「人力地震」地球上所有人在同一个地方同时起跳落地,地球会发生什么?
「机枪飞行背包」用向下射击的机枪能组装成一个飞行背包让人飞天吗?
「世界末日」如果地球和地上所有的东西都在一瞬间停止转动,但大气层还是保持原来的速度,会怎样?

生物题

「不孕不育会遗传不?」如果一个人体内所有的DNA在一瞬间消失了,会发生什么?
另外本文章分为:独立测试、横评对比存在的问题、值不值得氪金。小伙伴们可以按需快速前往相应版块。

1、数学题测试

问题1「人力显卡」
全球所有的人类放下手中工作然后参与到计算中能产生多少算力?这些计算能力和现代的计算机或智能手机相比谁更厉害呢?(没错,这是人类对英伟达发起的一次总攻!!!)

这算是一道比较简单的数学和逻辑推理题,o1思考了11秒,得出的结论是全人类心算/笔算的算力总和约8 GFLOPS。


…(内容过长省略)…


3、生物问题测试

问题1「榨干了DNA的人能活吗?」
考察点:
目的:考验AI对人体DNA的理解,毕竟AI也要广泛应用在生物工程学的研究中,如果不知道这些东西的作用谈何研究?

这里GPT-o1首先阐述个DNA的作用和影响,我整理了一下:遗传信息丢失(不孕不育了);转录停止(影响发育);蛋白质合成中断(不会变胖了);线粒体功能受损(身体能量发动机坏了)。综上所述,人废了。

经过计算一个成人体内DNA总量大概在150g左右,抽干这150g数秒内你只会觉得减肥成功,接着过几分会开始肌无力并且意识模糊,再过十几分钟就昏迷了然后心跳呼吸开始不规律,再过几小时人类史上第一个因DNA逃逸身体而生理飞升的人诞生了(R.I.P)。

而且这个死亡过程不可逆,其实咱可以理解为给细胞半衰期按了一个超快加速键,死亡是唯一的归宿。

最后一个就是AI届的数学难题,9.11和9.8谁大?思考5秒,9.11比9.8大,心疼我的1.5元。

---
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:[GPTNB](https://gptnb.com)。

实测 | GPT-o1:学会了思考,也学会了偷懒

https://www.gptnb.com/2024/09/17/2024-09-16-auto4-H9bCqZ/

作者

ByteAILab

发布于

2024-09-17

更新于

2025-03-21

许可协议