智谱AI静悄悄的上线了一大波新模型,过年了,真的。

文章来源:数字生命卡兹克

智谱今天下午在KDD 2024上面,悄咪咪的上线了一堆的超级更新。


我真的服了,我本来今天从泰国回来,准备休一天假的,结果晚上又坐在电脑面前被迫营业。
他们总是每次,静悄悄的就把4个2给扔出去了。

嗯,就一场演讲了,发布了一堆新模型还有新功能,个顶个都很猛。
我挨个列一下:
大语言模型GLM-4-Plus。
图像和视频理解模型GLM-4V-Plus。
AI绘图图模型CogView-3-Plus。
智谱清言上线“视频通话”
而且,这些新模型,已经全部上线了他们的开发者平台,现在,开发者已经可以直接调用API去进行开发了。。。

至于上线到智谱清言上面给普通消费者用,可能还得几天,我线上试了一下还都是老模型,毕竟模型太多了,这切换上去估计也费点时间。。。
说实话,我懵逼了,也麻了。
智谱AI就一直都是很这种地主家的傻儿子的感觉,这但凡是OpenAI,发这么多东西,必须让你先猜谜语3天,跟你玩个大反转。。。
一个一个说下:
GLM-4-Plus
全新的模型,看了下跑分整体基本上正儿八经的追平了GPT4o,而且智谱这家公司是很实诚的那种,真的不如就是不如,真的超过就是超过,不弄虚作假,所以这个跑分还是非常可信的。

AlignBench(对齐和遵循指令能力)还有MATH(数学能力)基本跟GPT4o打平,GPQA(小学问题)和LCB(代码)这块能打平GPT4o但是跟Claude 3.5还是有一些差距,Claude 3.5实在是太强了。
长文本这块,能力基本是打平或者超越。

我也去后台跑了一下GLM-4-Plus,效果确实是比之前强了。
至少之前我测试的那个很坑爹的调休问题:这么多AI大模型,就没一个能算清今年这破调休的?
基本所有的大模型都全军覆没,只有Claude3.5能连续答对5次。
而新的GLM-4Plus,这次居然也连续答对5次了。
很强,很猛。
而这个经典的动物过河问题:“农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。”

GLM-4-Plus也是3次连对,这道题之前也是所有的大模型全军覆没,…
Continued in the original article


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

智谱AI静悄悄的上线了一大波新模型,过年了,真的。

https://www.gptnb.com/2024/09/04/2024-09-03-auto4-X8pZAS/

作者

ByteAILab

发布于

2024-09-04

更新于

2025-03-21

许可协议