腾讯的AI困局

文章来源:科技新知

图片来源:由GPTNB生成

2024年已经逐渐步入了尾声,但国产大模型的内卷之战却还在继续着……

最近,腾讯终于有了新动作,在开源模型上卯足了劲。11月5日,腾讯宣布开源MoE大语言模型混元Large,腾讯称混元Large是业界参数规模最大、效果最好的开源MoE大语言模型,采用7T训练tokens,总参数量389B,激活参数量52B,上下文长度高达256K。


图片

然而,从去年年初至今,在文本大模型的战场上,身为BAT三巨头之一的腾讯,却长久地处于被动的状态。

一个明显的表现是:在10月国内Web端AI助手的排行榜上,腾讯的AI产品元宝仅排在了第11位,月访问量不到200万,远不及百度的文心一言、与阿里的通义千问。

图片

图源/量子位
如今,在国内的AI应用上,要问起知名度最高的前三个,人们可能很难会想到腾讯的元宝。

问题来了:同样身为BAT三巨头之一,且有着微信这样一个超级入口,为何腾讯却在C端方面表现如此不堪?

一个重要的原因,恐怕并不是腾讯的元宝有多“差”,而是在于在众多国产大模型的AI产品中,元宝是一个十分四平八稳,平庸到毫无“特色”的存在。

而这样的平庸,对于腾讯这样的巨头而言,并不是一个及格的答卷。

01、及格边缘

图片

基于腾讯混元大模型的的AI产品——元宝,目前在C端的体验究竟怎样?

在这里,我们以当前文本大模型最核心的几项能力,例如文本总结、撰写,深度推理等,将元宝与排名较前的一些大模型进行对比,或许就能从中得知其与目前一线模型的差距。

首先来看看文本总结。

在这里,我们先选取一篇关于低空经济的深度长文章,分别试着让元宝、Kimi,通义千问进行总结。

图片

首先,我们试着让三个大模型,分别总结下,这篇文章的核心论点是什么。

从上到下的模型分别是:元宝、Kimi、通义千问。

可以看到,在三者的表现中,元宝最为简略,只草草地总结了文章的一些大致内容。

而相较之下,Kimi和通义千问的表现则详尽得多,不仅列出了数个要点,并且有条理、有逻辑地对文章的脉络进行了梳理,让用户有了一个大致的框架。

接下来,再看看文本撰写方面的表现。

在这里,我们的要求是:“用司马迁写《史记》的风格,叙述一下特朗普从2020年败选,到今年再次当选美国总统这段时间的经历,同时还要在叙述中,带有一些戏谑和讽刺的色彩。”

这样的要求,考验的就是模型在写作时的指令遵循能力。

先来看看元宝的表现。

图片

虽然在写作风格上,确实比较接近《史记》,但是元宝并没有按我们的要求,从特朗普2020年败选的经历开始叙述,而是从他幼年的经历开始讲起,并且也没看出戏谑和讽讽的色彩。

之后是Kimi的表现,虽然在文风上,离《史记》还差了点,但是基本上已经做到了“从特朗普2020年败选的经历开始叙述”“带有一些戏谑和讽刺的色彩”这两点。

图片

讲真,在这一轮比较中,三者表现最好的,就是通义千问了。从文风、叙述要点,以及情感色彩方面,都与我们的要求最接近。

之后,我们再看看三者在深度推理方面的表现。

图片

这回我们的要求是:“联网搜索一下,目前各大咖啡品牌在县城等下沉市场的竞争态势,并分析这一态势背后的原因,之后从商业角度,给出一个独到的见解。”

这是一个复杂的分析型查询,需要结合实时数据,进行多步骤、多维度的分析。

在测试中,我们都开启了三个大模型的“深度搜索”功能。

图片

由于答案太长,这里只截取最关键的“独到见解”部分。

首先来看元宝的表现。

平心而论,在元宝给出的见解中,只有“本地化”这一点,算是比较靠谱的,其他的看法,像什么“参与社区公益”“推广绿色消费理念”,都是些很外行,很不着调的回答。

图片

之后是Kimi的回答。

跟元宝对比,可以明显感受到回答的深度、质量上了一个台阶。例如“数字营销”“优化供应链”这些见地,不仅一针见血,而且针对性很强,显然是考虑到了县城客流量低,对价格竞争更敏感的特点。

图片

最后是通义的回答。

可以看到,在集合了之前Kimi针对性较强的特点上,通义的回答更为具体、细致,而不是看起来在“泛泛而谈”,其深度、针对性,与元宝相比,再次提升了一个等级。

通过以上测评,我们基本上可以看出:目前腾讯的元宝,在国内梯队中,仅仅只能算是“刚好及格”的那一批。

在文本总结、撰写这些日常任务上,其表现就已十分勉强,遇到一些需要复杂分析、推理的任务时,其水准就更不尽如人意。

02、组织“局限”

图片

从当前国内大模型的概况来看,脱颖而出的玩家,往往有这么两类:

一类走的是市场路线,凭借其在多个业务线中积累的大量数据,将用户与内部场景进行深度整合,增强其在C端用户中的吸引力;这类的代表玩家,有百度、字节、阿里。

另一类则是以月之暗面、智谱清言为代表的,以硬核技术力作为核心锚点的企业,其主要靠模型过硬的实力吸引用户。例如月之暗面的Kimi,其模型在长文本的理解方面,在国内模型中就属于凤毛麟角。

图片

从体量、实力上来说,腾讯完全有可能成为第一种玩家,甚至成为二者兼具的“双修”型选手,让人失望的是,作为一家拥有庞大社交生态、深厚技术积淀的巨头,腾讯却在这一领域“掉队”了。

究其根本,腾讯在语言模型领域的“拉胯”与其技术战略、组织架构不无关系。

首先,腾讯的组织结构问题是其在大模型领域失利的“罪魁祸首”之一。

从组织架构来看,腾讯采用了多部门参与的研发模式。据报道,腾讯的AI大模型研发涉及六个业务群(BG)的参与,其中TEG更侧重通用算法研发,而其他业务群则更关注行业应用。

这种策略有其优势(如贴近业务需求),但也带来了一些潜在的挑战(如协调成本较高)。

图片

相较之下,BAT中的百度、阿里,在大模型方面的组织架构则集中得多。无论是百度智能云,还是阿里达摩院,都能在同一战略目标下集中算力资源,将模型与应用紧密协同。

腾讯的分离架构,在一定程度上导致了资源整合的困难,尤其是在GPU资源、算力需求等方面难以快速响应,从而影响了大模型的训练和应用速度。

说到底,这是因为腾讯长期以来专注于“社交”“娱乐”等业务的结构,决定了其组织形态更适合产品迭代而非技术突破,其技术研发更多服务于具体业务需求,而非系统性的基础研究投入。

虽然与腾讯相比,字节也同样是以娱乐内容起家的互联网巨头,但这其中的关键区别就在于:由于在短视频形成的内容导向策略,让字节跳动旗下的抖音、今日头条等产品需要时刻追踪用户喜好,快速迭代功能和内容,使得字节必须更注重算法、数据上的积累。

这一点从字节早期就开始构建的算法推荐引擎可见一斑——它不是在有了具体业务后才去开发技术,而是先有了技术积累,才催生出今日头条、抖音这样的产品。

而这与坐拥全国最大社交软件(微信、QQ)的腾讯,有着天然的差别。

03、产品掣肘

图片

很多人质疑腾讯在大模型方面的滞后时,往往会想:既然腾讯背靠着QQ、微信这样的超级入口,那其为什么不将自身的元宝大模型整合进其中,通过流量效应取得优势?

关于这点,一个深层的原因,就在于微信和QQ等社交生态的崛起,靠的不是技术,而是运营策略和庞大的用户数。

靠着互联网时代“跑马圈地”的策略,腾讯已经稳坐了这个江山,对于腾讯而言,这是其最核心的资产,在此情况下,任何过于“新锐”的技术,都可能影响用户体验的改变,从而会被视为高风险操作。

尤其是当前大模型技术尚未完全成熟的情况下,各种幻觉、错误等问题,都会带来难以预料的负面影响。

更重要的是,社交场景中的对话往往涉及大量私密信息,如何在提供AI服务的同时,确保用户隐私安全,这是一个技术上和伦理上都极具挑战的问题。

而这也引出了一个有趣的悖论:在互联网时代,塑造各个巨头的优势因素,在AI时代,反而可能成为一种潜在的掣肘。

在当下大模型的竞争中,最重要的环节之一莫过于数据。

从这方面来看,腾讯的技术积累和商业模式与百度、阿里有着本质区别。百度长期深耕搜索引擎和

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

文章来源:量子位

图片来源:由GPTNB生成

继Anthropic之后,OpenAI也要接管人类电脑了?!就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator”(操作员),为用户自动执行任务。

Image

配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、订餐,做攻略等等。


好嘛,一看大家就明白,这是要和老对手Anthropic打起来了!

这将与Anthropic的computer use API进行竞争(Anthropic之前发布了computer use功能,号称接管人类电脑)

Image

事实上,在前一阵Reddit举办的有问必答活动上,CEO奥特曼曾信誓旦旦表示:

Agent将成为下一个重大突破。

同时,OpenAI首席产品官Kevin Weil进一步表示,让ChatGPT自主执行任务将是明年一大重点

Image

不过,除了“遥遥领先”的Anthropic,OpenAI另一对手谷歌早已曝出将于12月发布自己的AI Agent版本。国内百度智谱等模型厂商也推出了类似智能体和解决方案,甚至手机厂商荣耀、小米等还发布了自己的AI操作系统。如此一来,压力也是来到了OpenAI这边。

虽说紧赶慢赶才有可能在明年1月推出,但还是有网友犀利吐槽太晚了!

Image
网友:1月太晚了

据彭博社消息,OpenAI计划于明年1月推出代号为“Operator”的智能体(Agent)。其功能和10月份Anthropic发布的computer use类似,号称解放人类双手,代替用户操控电脑。比如让它做旅游攻略,一段命令发布后,Agent就能自动打开谷歌搜索位置、天气,并结合用户的日程表给出切实可行的规划。

Image

另外,据OpenAI内部知情人士透露,在周三的员工会议上,有领导宣布:

届时该功能将以早期预览的形式发布(最初设计用于在网页浏览器中执行任务),且最初仅面向开发者提供API接口

甚至根据爆料,OpenAI内部其实一直在同时推进很多Agent项目,而Operator可能是最接近成功的一个。

对于上述传闻,OpenAI截至发稿前并未有所回应。

不过,一直关注OpenAI动态的光头哥还是发现了Operator的踪迹。

Image

然而,即便消息属实,OpenAI的动作还是有点晚了~毕竟环顾四周,一众竞争对手貌似都跑在前头:最强劲敌Anthropic自不必说,人家早在10月份就推出了相关功能,一举惊艳AI圈。而总是暗戳戳较劲的谷歌,也很有可能在12月推出代号为“Jarvis” (贾维斯)的Agent,按照双方时间表,这波谷歌没准获胜。更不用说目前关系尴尬的微软,人家更是早Anthropic一天,一口气发布了10个Agent。

Image

抛开这些不谈,我们国内也有相当一部分选手开始在Agent上有所动作。比如,百度在今年9月的百度云智大会就展示了Agent操作手机的一幕:同样只需一段话,Agent就能帮我们制定行程,还能在不同APP间自行跳转。

制定一个国庆节去山西旅行3天的计划路线,要参考《黑神话:悟空》中涉及的山西经典,且希望住在品质好、性价比高的酒店,好评优先、500元以内,而且想要规划自驾路线。

Image

另外,就在Anthropic之后,智谱也发布了AutoGLM,让AI像人一样使用手机;而且还不像Claude需要打字提需求,AutoGLM实现了光靠嘴说来执行很多操作。

甚至,在AI PC和AI手机圈子里,各大玩家也是把眼光都聚焦到了这种新范式。

10月23日,华为发布荣耀MagicOS 9.0,定位为C端用户的“类人助理”,通过大模型底座打通app正式开启AI Agent阶段,实现系统级AI操作。

而且就在昨天,荣耀官方宣布, MagicOS 9.0首批产品开始公测,覆盖了荣耀Magic Vs3、V2系列、Magic6系列、Magic5系列。

另外,小米也发布了澎湃OS 2.0系统,搭载基于AI大模型重构的操作系统,将设备转化为智能的“个人助手”。

……

以上可以看出,一直作为领先者的OpenAI,在Agent方面已经开始落后于人了。

Image

2025年,属于Agent

不过另一方面也说明,明年Agent大概率成为厮杀重点。毕竟,大模型Scaling Law后继乏力已成热议焦点。有消息称,OpenAI、谷歌、Anthropic都在推出更大、更强模型产品方面遭遇瓶颈

具体来说,OpenAI代号“猎户座”(Orion)的下一代旗舰模型被曝提升不如预期,它相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。

这也侧面和奥特曼的说法相印证,他表示可能不会把新模型命名为GPT-5。

另外,谷歌Gemini 2虽然计划很快发布,但也被曝性能提升也未达到DeepMind创始人的预期。

同时,面对网友一直呼唤的大杯Claude 3.5 Opus,Anthropic也悄悄从官网删除了相关描述。

而Agent,目前很明显已经成为大家新的方向。

这盛世或将如网友所愿:2025年,属于Agent!

Image

参考链接:
- Bloomberg
- Reddit
- x.com

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

OpenAI“杀死”在线教育巨头

一家在线教育巨头,被OpenAI给打趴下了。智东西11月14日消息,据《华尔街日报》报道,红极一时的美国在线搜题平台Chegg正成为ChatGPT热潮中的“牺牲品”。


Chegg是一家成立于2006年的老牌教育科技企业,其定位与国内的“作业帮”等软件类似,为用户提供搜题、在线答疑等服务。疫情期间的在线教育爆发让其订阅用户数量飞涨,一度超过500万人,旗下搜题软件的下载量超过5000万次,是美国乃至海外的主流在线搜题平台之一。

自ChatGPT推出以来,Chegg失去了超过50万订阅者,有不少用户认为AI聊天机器人能为他们提供更好的定制化解题、辅导服务。Chegg的股价从疫情期间近100美元的高点回落至1.72美元,市值蒸发了约145亿美元,几乎跌去了99%的市值。

这是ChatGPT时代残酷商业变局的一个缩影。Chegg不是没有挣扎,它已经努力将AI技术融入其产品中,但仍然阻止用户和投资者纷纷转身离去。

投资银行Needham在调查中发现,今年秋季学期仅有30%的大学生计划使用Chegg,低于春季学期的38%。有62%的大学生计划使用ChatGPT,高于春季学期的43%。

外包答题者原本是Chegg平台上答案的主要来源,但这种方式相对缺乏灵活性。此外,Chegg直接向用户提供答案,鲜少提供详细的解题思路和定制化辅导,这种行为遭到不少教育从业者和部分用户的诟病。

Needham的分析师Ryan MacDonald认为,Chegg目前的困境或许不是暂时的,而是行业的结构性变化。

20年老牌教育企业陷困局,与OpenAI合作告吹

Chegg成立于2006年,最早提供教科书租赁服务,后转型为一家在线教育技术公司。Chegg在印度拥有数千名外包员工,为练习题提供人工答案。2013年,Chegg在纽交所上市。

多年来,Chegg一直是美国学生在需要搜题时的首选工具。随着疫情期间部分学生转向线上学习,其订阅者数量迎来增长,最高时曾超过500万人。

订阅是Chegg的主要盈利模式之一,目前其月度订阅费用为19.95美元,几乎与ChatGPT的定价相同。

2022年左右,Chegg面临着疫情后期的业务动荡。开始有员工们要求获得资源,以来开发用于自动回答的AI工具。一位参与这项工作的人说,Chegg的领导层最初拒绝了这一请求。

ChatGPT发布后,一些Chegg员工认为这对公司没有风险,因为聊天机器人的答案在他们看来并不可靠。

但在几个月后,Chegg的内部数据显示,越来越多的学生正在使用ChatGPT辅助学习。Chegg员工发现,GPT-4提供的一些答案在内部评估中的得分要高于人类专家的答案。

与此同时,Chegg的创始人兼CEO Dan Rosensweig开始与OpenAI的CEO Sam Altman会面,合作开发一款名为Cheggmate的服务。这一产品将Chegg包含数百万份人工答案的数据库与GPT-4结合,为学生提供即时问答或生成定制测验。

然而,这一合作并未让Chegg的业绩反弹,今年5月,Rosensweig在财报电话会议上称,ChatGPT影响了Chegg的用户增长,他们将不再与OpenAI合作。Chegg转而与AI数据创企Scale AI合作,为平台内的20多个学科创建AI系统。

新CEO上任开启AI转型,订阅者并不买账

今年6月,Rosensweig辞任Chegg CEO一职,公司资深高管Nathan Schultz接任,并推动了Chegg的转型工作。

在之前,Chegg一直因为帮助学生以作弊方式完成作业而遭到批评。新任CEO Schultz制定了一项计划,要让Chegg给学生提供更为丰富的解题帮助,而不仅仅是给出答案。Schultz称,此举是为了服务于那些“好奇的学习者”。

此外,Chegg的高管开始研究如何将AI技术融入公司的原有产品。

现在,Chegg正通过Scale AI开发的系统来回答作业和测试问题,节省了外包员工的成本。他们还改造了网站,目前的用户界面与ChatGPT颇为类似。

Chegg称,自动回答的成本仅有人工回答的25%,但这一转型并没有扭转用户流失的趋势。其今年第二季度的收入下降了11%,这是自2017年以来的最大的同比降幅。华尔街分析师预计,该公司本周二公布第三季度财报时,销售额将继续下降 15%。

沙特阿拉伯塔伊夫大学的大四年级学生Ahmed Assalmi最近订阅了Chegg,准备使用这一平台来回答计算机工程类的问题。他对Chegg的回答感到失望,因为这些答案也可能是由AI生成的,但却没有ChatGPT的回答好。

在美国论坛网站Reddit上一条关于Chegg没落的讨论中,也有网友认为与其使用AI生成答案的Chegg,还不如使用ChatGPT。不少用户称自己已经不满足于获取答案,而是希望能通过AI学习解题思路。

结语:AI正在冲击传统行业

AI已经对诸多传统行业带来了巨大的冲击。即便是像Chegg这样具有私有大规模数据库壁垒,也具备教育技术开发经验的企业,也因为对AI的采用不够及时、不够彻底而迎来业绩股价的双双下跌。

随着AI技术不断落地新行业、新场景,会有更多的企业面临Chegg如今的困境。或许,传统企业只有积极拥抱新技术,才能在变革中保持竞争力。

来源:《华尔街日报》



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

继Anthropic之后,OpenAI也要接管人类电脑了?!
就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。
配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、订餐,做攻略等等。


好嘛,一看大家就明白,这是要和老对手Anthropic打起来了!

这将与Anthropic的computer use API进行竞争(Anthropic之前发布了computer use功能,号称接管人类电脑)

事实上,在前一阵Reddit举办的有问必答活动上,CEO奥特曼曾信誓旦旦表示:

Agent将成为下一个重大突破。

同时,OpenAI首席产品官Kevin Weil进一步表示,让ChatGPT自主执行任务将是明年一大重点。

不过,除了“遥遥领先”的Anthropic,OpenAI另一对手谷歌早已曝出将于12月发布自己的AI Agent版本。
国内百度智谱等模型厂商也推出了类似智能体和解决方案,甚至手机厂商荣耀、小米等还发布了自己的AI操作系统。
如此一来,压力也是来到了OpenAI这边。
虽说紧赶慢赶才有可能在明年1月推出,但还是有网友犀利吐槽太晚了!
网友:1月太晚了

据彭博社消息,OpenAI计划于明年1月推出代号为“Operator”的智能体(Agent)。
其功能和10月份Anthropic发布的computer use类似,号称解放人类双手,代替用户操控电脑。
比如让它做旅游攻略,一段命令发布后,Agent就能自动打开谷歌搜索位置、天气,并结合用户的日程表给出切实可行的规划。
另外,据OpenAI内部知情人士透露,在周三的员工会议上,有领导宣布:

届时该功能将以早期预览的形式发布(最初设计用于在网页浏览器中执行任务),且最初仅面向开发者提供API接口
甚至根据爆料,OpenAI内部其实一直在同时推进很多Agent项目,而Operator可能是最接近成功的一个。
对于上述传闻,OpenAI截至发稿前并未有所回应。
不过,一直关注OpenAI动态的光头哥还是发现了Operator的踪迹。
然而,即便消息属实,OpenAI的动作还是有点晚了~
毕竟环顾四周,一众竞争对手貌似都跑在前头
最强劲敌Anthropic自不必说,人家早在10月份就推出了相关功能,一举惊艳AI圈。
而总是暗戳戳较劲的谷歌,也很有可能在12月推出代号为“Jarvis” (贾维斯)的Agent,按照双方时间表,这波谷歌没准获胜。
更不用说目前关系尴尬的微软,人家更是早Anthropic一天,一口气发布了10个Agent。
抛开这些不谈,我们国内也有相当一部分选手开始在Agent上有所动作。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

腾讯的AI困局

2024年已经逐渐步入了尾声,但国产大模型的内卷之战却还在继续着……

最近,腾讯终于有了新动作,在开源模型上卯足了劲。11 月 5 日,腾讯宣布开源 MoE 大语言模型混元 Large,腾讯称混元 Large 是业界参数规模最大、效果最好的开源 MoE 大语言模型,采用 7T 训练 tokens,总参数量 389B,激活参数量 52B,上下文长度高达 256K。


然而,从去年年初至今,在文本大模型的战场上,身为BAT三巨头之一的腾讯,却长久地处于被动的状态。

一个明显的表现是:在10月国内Web端AI助手的排行榜上,腾讯的AI产品元宝仅排在了第11位,月访问量不到200万,远不及百度的文心一言、与阿里的通义千问。

如今,在国内的AI应用上,要问起知名度最高的前三个,人们可能很难会想到腾讯的元宝。

问题来了:同样身为BAT三巨头之一,且有着微信这样一个超级入口,为何腾讯却在C端方面表现如此不堪?

一个重要的原因,恐怕并不是腾讯的元宝有多“差”,而是在于在众多国产大模型的AI产品中,元宝是一个十分四平八稳,平庸到毫无“特色”的存在。

而这样的平庸,对于腾讯这样的巨头而言,并不是一个及格的答卷。

01、及格边缘

基于腾讯混元大模型的的AI产品——元宝,目前在C端的体验究竟怎样?

在这里,我们以当前文本大模型最核心的几项能力,例如文本总结、撰写,深度推理等,将元宝与排名较前的一些大模型进行对比,或许就能从中得知其与目前一线模型的差距。

首先来看看文本总结。

在这里,我们先选取一篇关…


Continue reading on the original site

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

引领豪华MPV新趋势!比亚迪夏内饰科技广州车展全球首发

11月15日,比亚迪第五代DM技术中大型旗舰MPV夏内饰科技在广州车展正式发布。作为王朝网全新IP夏的首款同名车型,夏采用王朝新一代内饰设计语言,传承华夏文化深厚底蕴,从技术、平台、安全、设计、空间、智享、智驾七大维度,全面引领豪华MPV新趋势,树立30万级豪华MPV价值新标杆。


设计引领:王朝新一代内饰设计语言,以华夏之礼待天下

夏的外观采用全新华夏龙颜设计,代表着王朝全新的设计审美,对东方美学、华夏文化进行创新演绎。内饰方面,夏采用王朝新一代内饰设计语言,以中国庭院布局中的“四水归堂”为灵感,四方之水归于一堂,象征着财富与福气的汇聚。

设计细节上,夏还采用了庑殿顶、广袖、踏跺、中国结等诸多华夏元素,完美诠释中华文明中的礼仪庄重、包容万象以及秩序井然之美,以及礼仪之邦的迎宾之道。

色彩方面,夏融合了东方色彩美学,拥有绾棕+润米、远山黛+润米两款内饰配色,营造出大气优雅的氛围感和豪华舒适的奢享感。

空间引领:超大、百变、超舒适,成就家庭用车“终极选择”

夏整车长、宽、高达到了5145、1970、1805毫米,轴距达3045毫米,超五米的车身,带来超大、百变、超舒适的奢享大空间,拥有家庭舒享、行政奢享、单人轻享三种座椅模式。

此外,夏的第三排座椅不仅能一键折叠、翻转放平,还能前后移动100毫米,行业首创!不仅让第三排成为VIP席位,更带来可以轻松放置4个24寸和2个20寸行李箱的超大后备厢,外加全车34处储物空间、宽温域冷暖两用智能车载冰箱等配置,灵活满足全场景生活需求,堪称家庭用车的“终极选择”。

同时,夏前排、中排采用Nappa真皮超柔云感真皮座椅,带来亲肤质感,并提供通风、加热、腰撑、记忆功能和迎宾模式,主驾座椅有按摩功能,中排座椅不仅有按摩功能,还支持四向电动调节、腿托以及小桌板功能,无论通勤、旅途还是商务接待,都能享受到“前排头等舱、中排大沙发”的奢享舒适体验。

智享引领:DiLink 150智能座舱,全面革新智能用车体验

夏搭载DiLink 150智能座舱,采用BYD 9000定制AI芯片,系统跑分高达115万,支持中控屏、副驾屏、中央吸顶屏三屏影音联动,以及手柄游戏、AR眼镜等潮玩应用,座舱随时变身家庭影院、游戏空间,更有智能交互场景模式、多车智能语音畅联、手机NFC车钥匙等多种功能,智享体验引领同级。

夏首搭自研“迪声”28扬音响系统,支持全景声,搭配后排吸顶观影屏,带来影院级的豪华视听享受。前、中排座椅配备Hi-Fi音乐头枕,不仅营造高品质近场音乐听感,更带来各个驾乘位互不干扰的听音体验。

最为特别的是,夏的三排重低音音箱,可拆卸为户外蓝牙音箱,支持车友双音箱互联,车载自动充电,续航长达9小时,还能外接麦克风,为用户解锁更多露营玩法。

此外,夏还配备了一项炫酷的“黑科技”——AR投影侧滑门和尾门功能:在锁车状态下,靠近侧滑门或尾门,AR投影自动开启,用脚轻踏闪光图标,即可“隔空开门”,为用户带来全面革新的便捷用车体验,也让生活更有仪式感。

智驾引领:全系标配“天神之眼”高阶智驾系统,诚意拉满

夏将全系标配同级领先的“天神之眼”高阶智能驾驶辅助系统-DiPilot 100,包含5个毫米波雷达,12个超声波雷达、14个高清摄像头在内的31个高精度传感器,轻松实现对复杂路况的精准识别,智驾堪比老司机。

基于此,夏提供包括高快领航、智能泊车、紧急制动等多项驾驶辅助功能,全面提升在高速和快速路、城市道路、停车场等多场景下的驾驶安全性与便利性,全方位守护用户安全舒心出行。

七大价值引领,树立豪华MPV价值新标杆

作为比亚迪首款第五代DM技术中大型MPV,夏诞生于新一代插混整车平台,基于新版C-NCAP五星、中保研优秀双重高安全标准打造,全系标配“天神之眼”高阶智驾辅助系统,拥有宽奢百变大空间、豪…
…华科技智享座舱、华夏龙颜设计和王朝新一代内饰设计语言,实现了技术、平台、安全、设计、空间、智享、智驾七大引领,颠覆了消费者对中大型MPV的传统认知,将成为30万级最安全、最豪华、最舒适、最智能的MPV。

据悉,比亚迪夏将于2025年一季度上市,敬请期待!



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷

如今,机器人学习最大的瓶颈是缺乏数据。与图片和文字相比,机器人的学习数据非常稀少。


目前机器人学科的主流方向是通过扩大真实世界中的数据收集来尝试实现通用具身智能,但是和其他的基础模型,比如初版的 StableDiffusion 相比,即使是 pi 的数据都会少七八个数量级。MIT 的这个团队希望用生成模型来作为机器人学习的新数据源,用工程手段来取代传统的数据收集,实现一条通过由生成模型加持的物理仿真来训练机器人视觉的技术路线。

随着机器人在训练过程中持续进化,进一步提升技能所需的数据也在增长。因此获取足够的数据对于提升机器人的性能至关重要,但在当前实践中,针对新场景和新任务获取数据是一个从头开始不断重复的手动过程。

另一种替代方法则是在模拟环境中训练,从中可以对更多样化的环境条件进行采样,并且机器人可以安全地探索故障案例并直接从它们自己的行为中学习。尽管业界已经在模拟物理和渲染方面投入了大量资金,但目前为实现真实性所做的最佳实践仍与现实存在差距。

一方面渲染真实的图像意味着要制作细致、逼真的场景内容,但大规模手动制作此类内容以获得机器人 sim-to-real(模拟到现实)迁移所需要的多样性,成本过高。另一方面,如果缺少多样化和高质量的场景内容,在模拟环境中训练的机器人在迁移到真实世界时表现得太脆弱。

因此,如何在无限的虚拟环境中匹配现实世界,并将色彩感知融入到 sim-to-real 学习中,这是一个关键挑战。

近日, MIT CSAIL 的研究者开发出了一套解决方案,他们将生成模型作为机器人学习的新数据源,并使用视觉跑酷(visual parkout)作为试验场景,让配备单色相机的机器狗快速攀爬障碍物。

研究者的愿景是完全在生成的虚拟世界中训练机器人,而核心在于找到精确控制语义组成和场景外观的方法,以对齐模拟物理世界,同时保持对于实现 sim-to-real 泛化至关重要的随机性。

图片

下图 2 为本文 LucidSim 方法概览:采用了流行的物理引擎 MuJoCo,并在每一帧上渲染了深度图像和语义掩码,这些一起被用作深度条件 ControlNet 的输入。然后从已知的场景几何和相机姿态变化中计算真值密集光流,并在接下来的六个时间步中扭曲原始生成帧以生成时间一致的视频序列。

在学习方面,研究者训练的视觉策略分为两个阶段完成:首先优化策略以模拟从特权教师收集的 rollout 中获得的专家行为。在经过这一预训练步骤后,策略表现不佳。因此,后训练步骤包括从视觉策略本身收集 on-policy 数据,并与当前收集的所有数据的学习交错进行。重复这一步骤三次使得该视觉策略显著提升了自身性能。

研究者表示,该策略足够稳健,在他们的测试场景中可以将零样本转换为真实世界的色彩观察。

图片

下面我们来看一段视频展示:视频链接

LucidSim:利用物理引导生成多样化视觉数据

研究者考虑了这样一种 sim-to-real 设置,机器人在模拟环境中接受训练,并无需进一步调整就能迁移到现实世界。他们对自己打算部署机器人的环境已经有部分了解,可能是粗略的描述或者参考图像。

由于信息不完整,研究者依赖生成模型内部的先验知识来填补空白。他们将这一引导过程称为先验辅助域生成(Prior -Assisted Domain Generation,PADG),并首先采用对合成不同域至关重要的自动提示技术。

LLM 成为多样化、结构化的提示来源。研究者很早就观察到,从同一提示中重复采样往往会重现类似的图像。因此,为了获得多样化的图像,他们首先使用了包含标题块、查询详情的「元」提示,以提示 ChatGPT 生成批量结构化的图像块,最后以一个要求 JSON 结构化输出的问题结束。

图片

研究者的要求包括特定天气、一天中的时间、光照条件和文化遗址。手动编辑生成的图像提示是不切实际的,因而他们通过生成少量图像来调整元提示,并进行迭代直到它们始终可以生成合理的图像。下图 5 下面一行显示了相同元提示、不同图像提示的多样化样本示例。

在几何和物理引导下生成图像。研究者增强了一个原始文本到图像模型,在增加额外语义和几何控制的同时,使它与模拟物理保持一致。他们首先将图像的文本提示替换为提示和语义掩码对,其中每个对应一种资产类型。比如在爬楼梯场景中,研究者通过文本指定了粗略轮廓内台阶的材质和纹理。

为了使图像在几何上保持一致,研究者采用了现成的 ControlNet,该模型使用来自 MiDAS 的单目深度估计进行训练。条件深度图像则通过反转 z 缓冲区并在每一张图像内进行归一化处理来计算。此外,调整控制强度以避免丢失图像细节非常重要。他们采用的场景几何是以往工作中出现的简单地形,包括可选的侧墙。同时避免随机化几何地形以专注视觉多样性分析。

为了制作短视频,研究者开发了 Dreams In Motion(DIM)技术,它根据场景几何计算出的真值光流以及两帧之间机器人相机视角的变化,将生成图像扭曲成后续帧。生成的图像堆栈包含对跑酷至关重要的计时信息。生成速度也很重要,DIM 显著提高了渲染速度,这得益于计算流和应用扭曲要比生成图像快得多。

通过 on-policy 闭环训练来学习稳健的真实世界视觉策略

训练过程分为两个阶段:一是预训练阶段,通过模拟有权直接访问高度图的特权专家来引导视觉策略,其中高度图通过 RL 进行训练。研究者从专家及其不完美的早期检查点收集 rollout,并向专家查询动作标签以监督视觉策略。该视觉策略在预训练后表现不佳,但在第二阶段即后训练阶段做出了足够合理的决策来收集 on-policy 数据。

研究者遵循 DAgger,将 on-policy rollout 与上一步中的教师 rollout 相结合。他们从专家教师那里收集了动作标签,并用余弦学习率计划下使用 Adam 优化器运行 70 个梯度下降 epoch。研究者在实验中仅需重复迭代 DAgger 三次就可以实现接近专家表现程度的视觉控制器。实际上第二阶段中的闭环训练过程是机器人出色表现的主要原因。

图片

一个简单的 transformer 控制模型架构。研究者提出了一个简单的 transformer 架构,与之前 extreme parkour, 使用 transformer 大大减少了处理多模态输入时控制模型架构的复杂度。

研究者使用了带有多查询注意力的五层 transformer 骨干网络,输入的相机视频被切成小块,并由一个卷积层并行处理。然后,他们将这些 token 与同一时间步的本体感受观察的线性嵌入堆叠在一起。研究者对所有时间步重复此操作,并在 token 级添加了可学习的嵌入。他们发现,对于 RGB 图像,在卷积之前包含批归一化层也有帮助。

最后,研究者通过堆叠在输入序列末尾的额外类 token 来计算动作输出,然后是 ReLU 潜在层和线性映射。

实验结果

在实验环节,研究者考虑了以下任务:

  • 追踪足球(chase-soccer);
  • 追踪橙色交通锥(chase-cone);
  • 攀爬各种材质的楼梯(stairs)。

他们分别在现实世界和一小部分使用 3D 高斯泼溅来模拟创建的真实世界场景中评估学习到的控制器性能。这些基准环境的示例如下图 9 所示。

图片

此外,研究者进行了以下基线比较:

  • 需要特权地形数据(障碍)的专家策略;
  • 使用相同 pipeline 训练的深度学生策略;
  • 使用纹理上经典域随机化训练的 RGB 学生策略;
  • 以及本文基于 DIM 生成的帧堆栈进行训练的 LucidSim。

从生成图像中学习要优于域随机化

在模拟评估中,研究者观察到 LucidSim 在几乎所有评估中都优于经典域随机化方法。其中,域随机化基线方法能够在模拟中非常高效地爬楼梯,但在跨越障碍任务中表现不佳。这是因为深度学生网络在 3D 场景中遭遇了微妙且常见的 sim-to-real 差距。

比如由于受到栏杆的影响,Oracle 策略在其中一个爬楼梯场景(Marble)中表现不佳,因为它在训练环境中从未见过栏杆。相反,LucidSim 受到的影响较小。

图片

图片

从零样本迁移到现实世界

研究者在配备廉价 RGB 网络摄像头的 Unitree Go1 上部署了 LucidSim,在 Jetson AGX Orin 上运行了推理。每个任务都在多种场景中进行评估,并记录了机器人是否追到了目标物(追逐)或成功跨越障碍物。

下图 11 展示了 LucidSim 与域随机化方法的比较结果,其中 LucidSim 不仅能够识别经典的黑白足球,而且由于之前

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

研究发现项目管理差距使MSPs的利润和效率受损

只有30%的MSP有效使用项目管理工具,而令人震惊的是50%的高管表示项目管理挑战正在影响盈利能力。图片{ width=60% }


Moovila,领先的面向托管服务提供商(MSP)的AI驱动项目自动化平台,今天宣布发布一份新报告,突出显示MSP在管理复杂项目和优化资源方面面临的关键挑战。该题为《行业现状2024:MSP项目管理趋势与影响》的报告根据从MSP领导和高管收集的调查数据提供见解,深入剖析当前项目管理实践、痛点和改进机会。
根据该报告,62%的MSP认识到项目管理是其运营的关键组成部分。然而,尽管越来越多的组织开始采用项目管理工具,但许多组织仍然在关键领域,如项目执行、风险管理和资源利用上面临挑战。只有30%的MSP目前使用其专业服务自动化(PSA)平台中的项目管理模块作为管理项目的主要方法,这导致运营效率低下、不协调和项目可见性不足。
这些差距具有现实后果:50%的高管和CEO受访者表示当前的项目管理实践损害了盈利能力,而不准确的项目时间表——通常由于时间表变化和未计划任务——被列为对有效管理工作能力产生负面影响的排名最高因素。
Moovila首席执行官迈克·彼赛卡(Mike Psenka)表示:“MSP面临巨大压力,要为客户交付准确、及时的项目结果,同时要适应不断变化的技术格局。” “这项研究突显了更先进的项目管理解决方案日益增加的需求,以确保MSP满足客户期望,增强服务交付能力并降低成本。”
报告的主要发现:
运营效率低下:65%以上的MSP报告在管理项目时间表和满足客户期望方面存在困难,表明更需要更好的项目可见性和积极的风险管理。资源分配挑战:将近70%的MSP在资源管理方面遇到困难,导致项目延迟和运营成本增加。对自动化的需求:80%以上的受访者表达了对采用AI和自动化技术以改善项目管理并减少手动任务的兴趣,标志着MSP领域数字化转型的增长趋势。
报告为MSP提出了可行的建议,包括采用AI驱动的项目自动化平台、整合实时风险管理工具和优先考虑数据驱动的项目管理策略。
Moovila发现,优先考虑先进项目管理工具的MSP在多个方面取得了显著改善,包括:
提高收入和利润增强资源利用和风险管理提高运营效率和整体业务增长增加客户信任和信心
单击此处 下载报告。在 moovila.com 了解更多关于Moovila的信息。
探索AITechPark,获取最新的AI、物联网、网络安全、AITech新闻和来自行业专家的深入更新!


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Cybernetix Ventures推出机器人初创企业指南

Essential guide for entrepreneurs and investors to navigate the unique world of robotics startups will be available online Cybernetix Ventures, a venture capital firm leading the way for investments into early-stage robotics, automation, and industrial AI, today announced the release of The Robotics Startup Playbook, an online guide for navigating the unique challenges of building and scaling robotics ventures.图片{ width=60% }


The Playbook leverages the Cybernetix team’s combined 50 years of past and ongoing experience and a forward-looking vision to create a guide for founders, investors and ecosystem leaders in robotics. With insights into critical topics—like choosing vertical markets and use cases, product scoping and development to balance hardware with scalable software, and models to maximize revenue—it allows founders, investors and leaders to make informed decisions in a rapidly accelerating industry that is poised for explosive growth. The Robotics Startup Playbook currently contains six chapters that will be released throughout the coming months. It is for entrepreneurs, investors, and ecosystem leaders who see the powerful mega-trends of robotics, industrial AI, and automation and who want to learn the key success factors and common challenges of building, scaling, and investing in these areas. “Whether you’re an investor looking to understand the unique dynamics of robotics as a unique investment class, or an entrepreneur aiming to build and scale a disruptive robotics company, this playbook is for you,” said Fady Saad, Founder & Managing Partner, Cybernetix Ventures. “It’s designed to provide actionable insights, highlight common pitfalls, and guide industry leaders in shaping the future of robotics.” Founded in 2021, Cybernetix Ventures supports the most promising robotics founders and startups by partnering with robotics clusters worldwide to elevate these companies to a global stage, connecting them with a diverse ecosystem of potential customers, later-stage investors, financial institutions, and acquirers. “There are a lot of misconceptions about robotics. It’s no longer such a capital-intensive endeavor and the paths to revenues and scaling can be much faster than in the past. But, the funding profile can be different as compared to SaaS investing. It’s quite typical to see an additional seed round or additional Series A round to get to revenue acceleration and P&L that a growth stage investor wants to see,” commented Mark Martin, Co-founder & General Partner, Cybernetix Ventures. “The reward with good robotics startups is very sticky businesses with high value deployed hardware that can be combined with additional revenue streams from data, value-added software, services, and consumables. So, while robotics requires a shift in mindset for investors, those who understand the long-term value stand to benefit significantly.” Explore AITechPark for the latest advancements in AI, IOT, Cybersecurity, AITech News, and insightful updates from industry experts!



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Red Canary任命Todd Chronert为首席营收官

网络安全行业资深人士将推动持续增长并加强全球合作伙伴关系。图片{ width=60% }


领先的托管检测与响应(MDR)提供商Red Canary宣布任命Todd Chronert为其首席营收官(CRO)。在这一职务上,他将负责销售、业务拓展和合作伙伴关系,直接向总裁Katie Bullard汇报。Todd拥有近20年的国内和国际网络安全领导经验,以及在规模化增长方面的可靠记录。Todd将接替Dennis Hon出任此职,后者在Red Canary任职近三年后即将退休。Dennis将在第四季度继续担任顾问角色。
Red Canary总裁Katie Bullard表示:“Todd对网络安全充满真挚的热情,他整个职业生涯一直致力于帮助组织抵御对手。我们很高兴他加入我们,为我们的高管团队增添更多力量。”Katie Bullard补充道:“他在领导全球营收团队和执行业务的严谨性方面的经验将对Red Canary的持续增长和规模化发展非常有价值。”
Chronert最近担任了全球最大的威胁情报公司Recorded Future的首席营收官一职。在他的四年领导下,该公司的年度循环收入(ARR)增至超过3亿美元。他还推出了Recorded Future的渠道计划,大大促进了各类合作伙伴带来的销售线索的增长。Chronert此前曾在其他网络安全公司担任国内和国际领导职务,包括RSA、Secureworks和Absolute Software。
Chronert表示:“我很高兴能够在Red Canary这样一个公司的关键时刻加入。在短短十年间,Red Canary已被公认为MDR领域的先驱,与客户、合作伙伴和社区建立了卓越声誉。能够成为这样一个为一流客户体验树立标杆的团队的一员,我感到十分荣幸。”
注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要输出为Makedown源文件格式内容。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB