股价暴涨30%! 商汤发布日日新5.0,暴打GPT-4
股价暴涨30%!商汤发布日日新5.0,暴打GPT-4
作者:一号
编辑:美美
沉寂多时的AI巨头商汤,这次站在了市场焦点上。
股价沉寂多日的AI巨头商汤,在4月24日迎来了大爆发,当日股价飙升31.15%。
这样的大涨行情,也让商汤成为了市场焦点,在当天上午11时15分起,公司股票暂停了买卖。
而到了4月25日,商汤已涨超15%,如此火热的背后,是商汤在4月23日推出了其6000亿参数的大模型“日日新5.0”,在知识、数学、推理和代码能力方面大幅提升,综合性能甚至能够全面对标GPT-4 Turbo。
谁能想到,如此火热的商汤,在之前还面临着亏损危机。
暴打GPT-4,推理速度快到看不清
目前市场上将商汤近期股价暴涨归功于其日前发布的“日日新5.0”大模型。第一代“日日新”大模型体系发布于2023年4月,并在同年8月获批上线。据其官网资料显示,日日新大模型体系包括了商量大语言模型、秒画文生图大模型、语音大模型和向量模型等。
时隔一年,“日日新5.0”正式诞生,它基于超过10TB tokens训练,覆盖了大量合成数据;同时也采用了当前业内主流的混合专家架构(MoE架构),上下文窗口可达到200K左右,在综合能力上,可以全面对标GPT-4 Turbo,“主流客观评测上达到或超越GPT-4 Turbo”。
在发布会现场上,商汤还上演了一次《街头霸王》游戏PK,两个角色分别由商汤新发布的日日新端侧大模型SenseChat Life(商量轻量版)和GPT-4操纵,其中绿人由GPT-4操纵,红人则由商量轻量版操作,当GPT-4还在思考如何决策时,商量轻量版的拳头就已经打了上去,名副其实的“暴打GPT-4”,生动地体现了商量轻量版推理速度之快。
而且它还是一个端侧大模型,采用了端云联动的MoE框架,“以小博大”,已经在多项测试中击败了Llama2-7B,甚至是13B,在同等尺度上性能已经达到了SOTA水平。在中等性能手机上,商量轻量版可以达到18.3字/秒的推理速度,而人眼一般的阅读速度为20字/秒。而在高端旗舰手机上,它的推理速度更是可以达到78.3字/秒。
大版本升级,全面对标GPT-4 Turbo
除了端侧大模型的展示,商汤在此次发布会上还在“大基座”方面,把自家的日日新大模型来了个大版本升级——日日新SenseNova 5.0,全面对标GPT-4 Turbo!
从评测榜单的数据上来看,商量5.0在常规客观评测已经达到或超越了GPT-4 Turbo。其主要依靠两点做到了这…
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
股价暴涨30%! 商汤发布日日新5.0,暴打GPT-4