Quest将GenAI集成到Toad中以提升数据库管理

新的Toad Data Studio和Toad Data Point版本提升了性能、连接性和可访问性
Quest软件公司,全球数据、网络安全和迁移软件的领导者,今天宣布对其数据库管理工具Toad Data Studio 2.0和Toad Data Point 6.4进行重大增强。图片{ width=60% }


这些更新引入了由人工智能驱动的新功能、扩展的数据库连接性和更大的可访问性,帮助组织在多个平台上简化数据管理。
根据Quest与Enterprise Software Group近期发布的《数据库管理市场景观与不断演变的DBA》报告,93%的组织在多平台环境中运作。此外,近一半的数据库专业人员并非最初被聘为DBA,但已承担起DBA的职责,这突显了技能差距。Quest的人工智能增强数据库管理工具解决了这一问题,通过自动化复杂任务和改善使用体验,使无论是经验丰富的专业人员还是不太熟悉数据库管理的用户均能轻松应对。这使得即使没有正式DBA培训的团队,也能维护性能、确保正常运行并保障数据完整性。
“管理复杂的数据环境不应成为商业成功的障碍,”Quest软件公司产品副总裁Bharath Vasudevan说道。“借助这些由人工智能驱动的增强功能,我们让任何技能水平的专业人员都能更轻松地管理、分析和整合跨平台的数据。随着越来越多的客户从Oracle转向现代数据湖,例如Databricks,我们希望简化数据集成并确保他们拥有适应这一过渡的正确工具。”
新增强功能包括:

  • 人工智能集成:新的由人工智能驱动的功能简化了工作流程,使有经验的DBA工作更高效,同时也令代码经验较少的用户能够自信地执行任务。
  • 扩展连接性:Toad Data Point 6.4现在支持Databricks,Toad Data Studio 2.0增加了对Oracle Cloud Fusion的连接。这些新增支持使得用户在现代数据环境中拥有更大的灵活性,可以无缝管理和集成跨平台的数据。
  • 全面可访问性:所有拥有有效商业许可证的Toad for Oracle客户均可通过从试用页面下载,免费访问Toad Data Studio。该软件会自动识别他们现有的许可证,使他们能够在没有额外成本的情况下探索多平台数据库管理。

GlobeNewswire是全球最大的新闻发布网络之一,专注于向媒体、投资社区、个人投资者和公众传递企业新闻稿、财务披露和多媒体内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

2025中国AI开局:硝烟即将燃尽,对抗还是共生?

“这个春节没闲着。”不止一位AI公司的高管,在2025年开工后这样感慨。


中国AI行业,正以前所未有的速度加速狂奔。

DeepSeek不光是在春节期间轰炸了美国科技圈,也倒逼整个中国AI行业在春节前后都紧锣密鼓地赶进度——发模型,接产品,搞开源。

“半夜发新品”,成为了中国AI公司们的新常态:无论是最近爆火的Manus,还是通义最新开源的推理模型QWQ-32B,“经常一觉醒来,又被什么黑马公司和新技术轰炸。”

一日三变的行业,时常轰炸着AI从业者的神经。

这些“黑马”的公司们,虽然以“杭州六小龙”声名大噪,但AI公司真正密度最高的地区,依然是“宇宙中心”五道口的周边5公里内——这是清华系和中科院自动化所的势力范围,培养中国顶尖AI人才最多的两所高校。

为了招聘清北的人才,DeepSeek创始人梁文锋把北京办公室放在了清华南侧约2公里的融科大厦;智能体Manus背后的公司,则藏在北京海淀区花园路社区的办公园区里,毗邻字节跳动。

曾经的“宇宙中心”,又在大模型的加持下恢复了荣光。

在五道口一个十字路口的周围,就坐落着智谱、百川智能、生数科技、面壁智能、无问芯穹、趋境科技等多家AI明星创业公司。

铁打的写字楼,流水的创业公司。在大模型发展十倍于互联网的速度时,每家公司都在玩命狂奔,否则可能活不过五道口“枣糕王”。

在这里的每一家咖啡厅,你都可能撞到聊AI的从业者;晚上聚会后,有人会转身回公司继续加班到凌晨。

机遇的兴奋和内卷的焦虑,是这里空气的味道。

2025年的第一季度即将过去,AI公司的爆红和洗牌时刻发生,产品在各种测试集上的排名不断变换。

2025年,是行业内期许的Agent(智能体)爆发之年,也可能是基础大模型之争迎来终局的一年。

短期内,技术优势将是争取时间窗口的最佳武器。而在这段时间内,一场针对着场景、流量、人才的拉锯战正在展开,手握更多资源的挑战者,和占据先发优势的守擂者,两者都在拼命奔跑。

预期调整:基模之战

收尾、垂类竞争加剧

如果用一个词连接2024和2025,“预期调整”恰如其分。

一年过去,王者不再。曾经如日中天的OpenAI渐渐被竞争对手Anthropic超越,最新发布的大模型GPT-4.5也不再给业内带来轰动,更多是失望。新的技术和产品仍然高频出现,挑动着从业者的情绪。

就连去年不相信AGI、拒绝看任何一家AGI公司的朱啸虎,也在看到DeepSeek后直呼“我肯定会投”。

认知的反复颠覆,频繁地发生在AI公司的掌门人身上。

提到过去一年AI发展的关键词,容联云副总裁&诸葛智能创始人 孔淼向光锥智能表示,2024年对于大模型的市场价值预期调整,从完全buy in模型能力,到开始关注应用,从技术驱动到业务参与。

“无论是对技术的调整,还是对商业化的规划,大家的预期都在进行调整。”孔淼说。

从OpenAI出走的科学家ilya宣告“预训练达到上限”、用于训练的公开数据早已耗尽,到传闻中的GPT-5亦未如期而至,到国内六小虎之一的零一万物宣布放弃超大模型预训练,再到DeepSeek横空出世,打破算力桎梏。

2025年开局的前两个月,AI圈的变动已经掀起了国内外的一场地震。

以春节期间爆火的DeepSeek来说,它的出现为什么能够让从业人士振奋?DeepSeek将给行业带来什么样的意义?

像素绽放 PixelBloom(AiPPT.cn)创始人兼CEO 赵充将它归纳为三点:开源带来的技术红利、C端AI应用的成本门槛降低、中国AI“场景定义技术”进入新阶段。

赵充表示,DeepSeek的开放策略倒逼全行业重新思考技术垄断的边界。此外,其引发的成本革命将决定商业终局。

“当千亿参数模型的推理成本从‘开超跑’降到‘骑共享单车’,意味着AI应用终于能规模化服务普通用户。” 赵充说。

在此基础上,一众产品也将迎来“场景定义技术”的新可能——谁能用更低的成本解决更具体的问题,谁就能重新制定游戏规则。这也是中国创业者最擅长的战场。

另外,DeepSeek也加速了基模大模型的终场战争。有多位人士向光锥智能表示,预计基础大模型之战会在2025年杀出结局,尘埃落定。

开年起,零一万物宣布退出超大模型预训练,坦率地公布了公司从追求AGI到聚焦商业化落地的转变。而其他几家公司的变动也在持续发生:MiniMax首次发布了开源模型,以“线性注意力”机制代替了传统的transformer架构;在众人视野中沉寂的百川智能年后发布了首个全场景推理模型Baichuan-M1-preview,王小川依然专注医疗领域的应用。

李开复曾提及,“超大模型是大厂才能玩的游戏”,而对于其他五家公司来说,烧钱、攒人才的庞大战争同样难以持续。

但DeepSeek爆火后,大模型依赖算力的故事似乎又被改写,大厂资源似乎又输给了极致的技术创新。

生数科技联合创始人兼总裁唐家渝看到,一批有技术优势的企业弯道超车的机会。他告诉光锥智能,从DeepSeek身上能明显看到技术从算力依赖变为算法依赖,这意味着过去大厂拥有的算力资源不再是明显优势,一批有核心技术门槛的大模型创业公司,将利用自身算法等技术优势快速占领市场。

相比之下,对于六小虎接下来的梯队变化,多数人更看好以B端业务为主的公司们。

多位业内人士向光锥智能表示,在这场大模型创业公司的战争中,to C的公司可能会更早结束战争,而to B的公司相对存活时间更长。

“相对于C端来说,B端其实有防御纵深,它是大厂纯靠流量打不下来的一个地方。”赵充告诉光锥智能,to C的公司很难抵抗字节“豆包”和腾讯“元宝”两家的竞争压力,但像智谱等拥有一批B端客户的公司来说,这些是能靠得住的,B端也是更适合前期商业化的模式。

除了通用大模型的竞争,一些正在趋于成熟的垂类行业竞争也在加剧。

以AI视频为例,在这个Sora、可灵、生数、海螺等选手“神仙打架”的赛道,已经从最初的PPT形态,向着更加拟真的质量进化。

对于越来越“卷”的AI视频生成赛道发展进程,唐家渝的判断是,这场战争会在今年划下句号。

“今年,国内AI视频生成领域可能只会留存3家顶尖企业,全球是5家。”

在唐家渝的眼中,2025年,AI视频生成已经来到了一个“人人可用”的阶段。对于没有做视频经验的小白来说,也能轻松上手。

“人人可用”的背后,是AI视频的“不可能三角”正在被逐步打破,即速度、成本和质量可以兼得。

在赵充看来,AiPPT.cn在国内的战争早在2024年就已经完成,“只需要巩固优势即可”。接下来,他们的重点将会放在海外市场。

如果说生成式AI像一个夹心饼干,除了基础大模型和应用层之外,身处中间的AI Infra一直被认为是确定性很强、但并非那么性感的生意。

关注AI硬件领域的投资人林松告诉光锥智能,2025年,AI Infra领域会更加“卷”。

“这些企业至少能活,也能有零售、有利润,但是如果行业找不到一些特别大的增长空间的话,我觉得增速可能会快速减少,这个时候一旦卷起来就比较难受。”林松说。

林松表示,经历过2023年的指数级增长阶段,2024年的投资放缓是一个正常现象,既是因为竞争态势稳定,也是一个去泡沫的过程。“2023年投的大多是从0到1的企业,所以肯定是重金投入,越到后面,公司需要的资金(比例)也会降低。”

砸钱、整队,

中国的巨头确实会跳舞

在这场逐渐收紧的战争中,大厂队正在付出更多的人力和财力All in AI。

免费、开源、联动DeepSeek都是开胃菜,每当有新的细分领域的机会出现,大厂想要上车的决心迫切极了。

新的现象级产品出现后,焦急的一批人中一定有大厂的身影。

有大厂AI产品负责人向光锥智能表示,Manus引爆AI圈的当天下午,他所在的组专门拉了会议,紧急讨论:“Manus到底是怎么实现的”、“最快我们多久能复现”。

在追逐技术之外,大厂们正在用场景和生态提前布局,调整随时都在发生,排名的变化可能只是一夜之间。

这种调整首先体现在大厂一再变化的组织架构上。从字节到阿里、再到腾讯,将大模型研发团队和to C产品团队拆分成了一步必下的棋。

阿里的AI to C战略正在一天比一天清晰。从2024年末,归属于阿里云的通义App团队并入阿里智能信息事业部,再到今年,夸克和通义千问完成合并。

有接近阿里的人士向光锥智能评价,夸克团队打法凶猛,通过把商业化偏弱、工程师性更强的通义千问团队并给前者,靠夸克的4000万DAU,直接可以把流量导入给后者。

今年,腾讯也同样加快了分拆团队的步伐。在刚刚过去的两个月中,腾讯先后将腾讯元宝从TEG事业群调整至CSIG(云与智慧产业事业群);将QQ浏览器、搜狗输入法、ima等产品团队,从PCG(平台与内容事业群)转入CSIG(云与智慧产业事业群),将经由AI再升级的产品放在一起发力。

其中,腾讯元宝也转交给腾讯会议负责人吴祖榕负责,腾讯或许是希望靠C端产品经验丰富的负责人提升腾讯元宝的影响力。

如果说2024年,还有大厂处在观望和试水阶段,到2025年,所有大厂都在押注超级 AI应用诞生的可能性,并不惜一切代价调用人才和金钱。

“在起跑的第一年,团队还没调好是很正常的,”有业内人士告诉光锥智能,“从2025年上半年开始,各公司的老板都会选出最强选手带队,重新排兵布阵。”

比如过去两年在AI上反应比较慢的腾讯,有前腾讯的技术中层向光锥智能分析,腾讯在人才、经验的积累上,在大模型来临之后没有很好地应用到AI发展中。比如之前专注于机器学习的腾讯优图团队,并未接手AI视频模型的训练工作,而现有人员调转向新的视觉模型架构方向的过程中,也很难快速切换方向。

调整团队之外,大把砸钱也是大厂的常态。相比于创业公司,资金池充足的大厂在硬件端投入更加雄厚。

年后,几家大厂陆续公布的未来规划,透露着相同的野心。1月23日,路透社爆料字节跳动今年将拨出超过200亿美元,用于AI芯片、数据中心以及其他硬件。2月24日,阿里宣布,将在未来三年中投入超过3800亿元,用于建设云和AI硬件设施,其总额已超过过去十年总和;百度次日宣布,将投入110亿元用于AI基建。

但在不确定性更强的AI 2.0时代,真金白银不一定换来奇迹,洗牌随时都在发生。

在被称为“AI Agent之年”的2025,生态既是大厂弯道超车的希望,也是小厂望尘莫及的壁垒。

有人利用DeepSeek推广自家产品,有人则在新鲜血液的启发下及时调转船头,走向开源之路。

前两年,坚信“闭源才能带来更好商业化”的李彦宏,开始积极拥抱开源。不仅旗下旗舰模型文心一言4.5大模型宣布将于6月30日开源,还决定将文心一言旗下所有模型全部免费供应。

“我在过去几个月中学到的是,开源可以帮助你获得更多关注。我们正处于AI、生成AI创新的早期阶段,更快的传播将有助于提高采用率,但也有助于更多的人尝试这项技术,从而在应用层促成创新。” 在World Governments Summit 2025峰会上,李彦宏这样谈论开源。

从文本大模型开源起,这股“开源风”也在多模态领域中延续下去。2月25日,“开源大户”阿里再度开源万相2.1视频生成模型;3月6日,腾讯在此前开源文生视频模型的基础上,再度开源图生视频模型。

目前,备受瞩目的四家大厂中,阿里、腾讯和百度均已坚定了走开源的路。相较于前三家,致力于打造“AI应用工厂”的字节跳动,目前还在闭源。

在做基础模型上,字节仍然在招兵买马,或许对内部自研模型有着更高的期待。

2月17日,在谷歌Gemini工作的吴永辉博士加入字节跳动,据悉将担任大模型团队Seed基础研究负责人,专注大模型基础研究。

从张一鸣熬夜看论文、拉作者聊天,到部门早早调整,调兵遣将,先后成立负责AI应用的部门Flow和主管大模型技术的Seed,看得出,字节押注AI的决心一天比一天强烈。

有接近字节的人士告诉光锥智能,相比于前几个月,字节在Q4阶段的发展速度变得更快了。这是由于字节整体公司战略高度再度提升,其投入的各种资源继续“加码”。

遵循着“大力出奇迹”的打法,字节把豆包抬到了同类产品中Top 1的位置。不过,这个位置并非高枕无忧。

“从豆包的视角来说,它的第一竞争对手是腾讯,其次才会是百度和夸克,”有受访者向光锥智能表示,“不过,其实潜在的最大威胁者是华为,加上智能终端的优势,华为将会成为最有力的竞争对手。”

对抗还是共生,

创业公司怎么选?

创业公司在“卷”上,丝毫不输给巨头。

随着时间的推移,压在创业公司身上的压力正在加剧。面对大厂有流量、有场景壁垒,创业公司是对抗还是共生?

通往AGI的第二年,融资困难、不够挣钱,已经有不少创业公司倒下。它们之中最好的结局可能就是被某家大厂收购,比如被谷歌纳入麾下的Character.AI,更惨的则是公司宣告破产,而员工还在走仲裁,试图要回拖欠的工资。

但在这一轮AI行业的发展中,针对创业公司的收购玩法发生了一定改变。收购方不再大方地把一家创业公司的员工和财产全部接收,而是只挑走核心人才和算力设备。当一家公司的核心被掏空,剩下的只是躯壳。

在越发艰难的创业环境下,“不碰大厂的生意”成了创业者们心照不宣的原则。

从OpenAI到DeepSeek,技术创新,依然是掀大厂桌子的最有效路径。

回顾AI 2.0时代和AI 1.0时代的差异,作为两个时代的亲历者,唐家渝能明显感觉到两者之间的异同。

“两个时代都靠积累,但AI 1.0时代更多靠的是成熟经验的积累或获取,比如方案明确的标注数据,具有模型调参经验的成熟人才,只要资源到位,事情基本就能做成。”唐家渝说,“但AI 2.0时代具备更多的不确定性,处于技术的发展期,解决技术难题的路径并不确定,还需要创业公司基于自己的认知循序渐进。

但也正因为如此,创业公司才有弯道超车的机会。

不过这代创业者和2014年不同,在创业之初,很少有公司能不考虑和大厂之间可能存在的战争。对于创业公司来说,如何活下去,也是一开始就必须考虑的问题。

对于更偏向应用的AiPPT.cn来说,他们在第一天就确立好了自己和大厂共生的打算:通过合作的方式,借助大厂抢占尽可能多的流量入口,成为垂类赛道的头号玩家。

“我们的定位不是通用智能体,而是垂类智能体,所以我们跟所有大厂基本上都是合作关系。”赵充说,“目前国内大约30个核心大厂玩家,其中一半以上都选择和AiPPT.cn独家合作。这一块的话我们在国内几乎没有竞争,几乎是断层第一。”

通过和大厂平台、智能硬件端等渠道的联动,赵充表示自己总能够得到免费的流量。“比如联想去年AIPC的出货量到Q2增长30%,我就跟着它走就行。”这样做的好处是,无需在投流上花费太多成本,也能尽可能触达更多用户。

赵充分享,在2024年结束之前,AiPPT.cn已经顺利突破千万用户大关。

在用户增长层面,AiPPT.cn的思路也同样突出了和大厂避免竞争的想法。

“我们得和大厂做错位,我们做品(产品)之前都会先和大厂沟通,避开那些高频刚需的品。”赵充说,“像PPT其实是低频刚需,这样可以尽可能选择和大厂做互补。”

在赛道的选择判定上,一些创业公司也在遵循着避让的思路。其中,一些公司选择了规模小的市场,它们不在大厂的射程范围内;另一些公司则选择啃下那些对大厂来说更费力的硬骨头。

“市场规模太大的,基本上都是大厂射程范围内,大厂的战略部门其实都是很聪明的,所以那些能赚大钱的都不要考虑。”赵充说,“业内交流的时候,有朋友分享自己的经验,超过10亿的市场他都不会去做。

专注于金融、客服领域的容联云,做的就是“啃硬骨头”的工作。在孔淼的眼中,大模型发展带来的新订单,更多还是需要交给行业服务厂商完成。

“大模型厂商做投标,拿到了会把行业应用场景相关的工作分包出去。” 孔淼解释道,因为企服需要行业经验的沉淀,所以大厂一般会选择交给垂类领域的服务商。

“大模型能力只是解决了很多场景的AI泛化能力,但它只占据所有需求的20%,剩下80%落地的脏活累活也好,但是你站在一个行业应用厂商的角度来讲,它可能就是一个产品标准。” 孔淼说,“行业内客户的这些工程项目和技术需求,大厂一看80%做不了。其实,不是他没有技术能力做,是他没有knowhow(行业专业知识),所以不太能做这么细的市场。”

和大厂业务线有部分重合,生数科技的做法则是,通过技术优势拉开时间窗口,再从细分领域尽可能多地占据用户心智。

“共存是一个极有可能发生的事情。” 唐家渝表示。对于生数科技来说,他们在不断探索技术能力的同时,也在B端和C端的应用落地上发力。

“从战略层来说,我们首先会在AI视频生成的一些细分应用行业站稳脚跟,比如泛娱乐、动漫等,为一些面向C端消费者的平台提供B端服务。” 唐家渝说。“比如现在用户提到AI视频生成动漫,包括日本在内的国内外地区用户的第一选择就是生数科技Vidu,我们希望占据更多类似这样的行业赛道,成为用户的’第一选择’。”

以动漫为例,只需要创作团队画几个关键帧,中间的一些片段全部可以交由AI生成,这会大幅缩减制作成本和时间。比如,在动画剧集的制作环节,普遍成本在1分钟10万左右,但Vidu可以在实现相同视频效果的同时,将成本降到原来的不到十分之一。

“之前我们承接的电影《毒液》官方宣传片,是一个水墨版本的动画, 帮助制作团队减少了约90%的后期时间。”

在C端层面,唐家渝分享,他们目前正在关注由新技术催生的新内容消费模式,随着AI时代的到来,这些新的内容不一定最适合长在抖音、快手上。在内容形式演变中,新的机会点正在诞生。

找准自身定位和规划,创业公司才能在2025年跑得更远、更久。

2025,智能体的“爆发之年”

用户对AI的感知越来越明显。

当身边的家人也能随时随地打开豆包提问;当更多写报告、写论文、做PPT的活被人们习惯性地扔给了AI,没有人会再质疑AI是泡沫,而是在铺天盖地的新产品中不断地尝试和摸索。

翻开最近的App Store应用排行,免费榜单中位列前七的应用,有四个是AI应用。DeepSeek位列榜首,其次是字节豆包、腾讯元宝和阿里夸克。

而从2024年开始,一批“千亿俱乐部”的C端应用玩家已经出现。根据AI产品榜统计,截至2月,以DeepSeek为首的11个产品已经突破千万访问量。

多位业内人士对光锥智能表示,2025年会是智能体的“爆发之年”。

就在3月初,Manus的出现和爆火,正是2025年“智能体之年”的一个强有力的符号。

“更少结构,更多智能(Less structure, more intelligence)”,喊出口号的Manus证明了,当下大模型能力的溢出已经到达了一个临界点,在底层架构能力足够支撑的情况下,如何将能力串联在一起,让智能体在规划、执行的流程中尽可能少犯错,这考验的是AI公司们的产品力。

与以往不同的是,其他追赶的企业需要时间去复现甚至超越同样的技术,往往需要更长的时间,但这次,复刻在不到1天的时间内完成了。

无论是3个小时开源出“Open Manus”的MetaGPT,还是打出“0天复刻”、目前市面上复刻表现最佳的OWL。它们的存在都证明,风口来临之前,早有人在同方向做着同样的事。

“单一任务执行完成的Agent,一定会在今年实现。”Pokke AI创始人朱哲清在锦秋基金的分享会中表示。

而一批借助AI能力升级或新创的App,也将在今年迎来爆发。

从必要条件——成本来看,得益于大模型基座成本的优化,一些AI应用厂商早已经实现了收支平衡,即使不做付费产品,也能靠CPC(浏览广告付费)的模式打平成本,实现盈利。

制作过“哄哄模拟器”的开发者王登科最近公开分享,其团队AI陪伴应用“独响”在免费用户依然可用的情况下,基本达到了收支平衡。“我们不为大模型烧钱,并可以养活团队。”

一些行业正在被AI改写,甚至颠覆。以SaaS行业来说,微软CEO萨提亚·纳德拉曾经做出过预测:AI Agent (智能体)将从根本上改变 SaaS 的定义,它甚至会终结一部分原有的服务模式。

“大模型出现后,已经在一些行业应用落地之后加速,原来我们以为是5-10年,现在是3~5年,很多企服公司一定会被干掉。”孔淼说。以前大模型是起到辅佐人力的作用,而现在,代理可以完成一些多业务流程自动化的过程,再实现多智能体协同,这是一个很大的颠覆。

AI和SaaS的结合过程中,一开始,AI将先通过大模型能力为企业增加竞争力,从而提升客单价,出现增量。以客服为例,原先只是单纯的在线机器人,现在它可以做一些客户沟通记录总结,企业再针对这项服务单独收费。

但放到中期来看,这部分增长的市场迟早会萎缩。孔淼告诉光锥智能,通过使用工具做大部分提升,(容联云)将把原有的这种SaaS软件流程替换掉。“我们不再需要后台有训练师、业务流程配置师,而是自动通过大模型去配置流程,那么原有的软件服务将会被端到端的代理软件替换掉,蚕食原有的市场。

此外,通过Agent代替人力,能够大幅提升人效比,这相当于把原来的软件及服务变成真正的软件服务,让用户真正按效果付费。

比如在金融领域,当券商需要响应政策,把质检纳入业务范围内,大模型的介入就帮助这些公司节省了人力资源。

不过,受制于行业知识壁垒,以及一些行业对隐私性、准确性的特殊要求,AI在千行百业的落地仍然需要时间。

“AI在金融行业中的融合是必然的,只是一些需求的落地需要解决,这属于时间问题。”孔淼说。“金融现在的落地点,需要经历业务流程和数据调优流程,软件工程RAG的落地需要时间。从以前压根不可能规模化,到现在,需要时间来帮助行业重塑业务流程。”

不过,仍然有一些赛道还尚未迎来明显的拐点,需要等待技术成熟和团队找到差异化优势。

以AI硬件赛道热门的AI眼镜来说,林松认为,这个赛道目前还是大厂更具备优势。

“耳机、眼镜,都和手机息息相关,如果有手机生态、供应链和行业用户的认知、用户渠道、内容衔接,相比之下肯定(手机厂商)更有优势。”林松说,“作为新的创业公司,你得有足够新的创意,且具有一定护城河,才有可能突出重围,避免被大厂快速攻破技术门槛。”

在确定和不确定中,正如唐家渝所言,AI 2.0时代,新的可能性仍在不断涌现,而跑在前列的团队不能只是经验依赖型。AI公司,需要通过提升人才密度和人效比来加速奔跑。

赵充还向光锥智能分享了他的感受:

“回顾这三年,2023年可能还有人不相信AI,2024年基本所有人都相信AI,并且投入其中。2025年,所有的App基本上都会被AI改造一遍,所有的行业全部明牌,大家拼的就是执行力。” 赵充说,在过去的一年,他的团队人数翻了一倍。

AI时代的群体疾驰,恰如互联网时代的又一缩影。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

汤道生谈腾讯大模型:腾讯要打造“好用的AI”

腾讯的AI业务,究竟是如何布局的?

今天举办的腾讯全球数字生态大会上海峰会上,围绕大模型的研发与应用,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生详细解读了对于AI的思考和业务最新进展。

汤道生表示,DeepSeek的开源与深度思考的突破让大家都很兴奋,它给大模型带来的绝不只是评测多跑了几分的“量变”,而是里程碑式的“质变”。


用户在实际使用过程中,切实感受到了AI的“可用性”在进一步提升。

“AI正在跨过产业化落地的门槛,站在普及应用的全新节点上。行业由之前的模型训练主导,发展到今天更多是应用与Agent驱动;我们看到,云上DeepSeek API调用量激增,语音交互的需求也带动了ASR(自动语音识别)与TTS(文本转语音)模型的API调用;模型推理的算力消耗正在高速增长,规模化推理的成本优化,成为云厂商的核心竞争力。”汤道生说。

面向未来,腾讯将立足于用前沿的AI技术,打造“好用的AI”,为用户提供有实效、有温度、可进化的智能产品和解决方案,助力大家的美好生活,推动实体产业创新突破。

汤道生强调,腾讯将做好两个坚持:一是坚持在模型研发上的持续投入,全力夯实模型底座,满足不同场景的需求;其次是坚持“用户为先”,将AI与多元场景深度融合,打造高可用、高稳定的AI应用,为用户带来“有用、好用”的智能体验。

大家上午好!

很高兴与大家相聚在腾讯云城市峰会,共同探讨数智化带来的创新发展与产业机遇。我们把峰会的首站定在上海,也是想借这个机会,对上海市政府长期以来给予我们的关心和支持,表示衷心的感谢!

上海是改革开放的前沿阵地,外贸进出口总额超过4万亿元,超过1000家跨国公司在这里设立了地区总部。上海也是技术创新的标杆,集成电路、生物医药、人工智能三大先导产业,产值突破了1.8万亿,其中人工智能产值超过4500亿,位居全国前列。

这些年,腾讯也为上海的发展持续贡献力量。我们打造了长三角地区算力规模最大的人工智能计算中心,建设了腾讯优图、科恩等创新技术实验室;服务了临港集团、上汽集团、老凤祥等一大批本地企业的数字化升级;也帮助外资企业更好的扎根中国;支持出海企业拓展新市场。

半个月前,我刚刚来过上海,和本地几家企业展开了深入交流,明显感受到,大家对于增长的信心显著回升。当下,AI新技术的快速突破,实体产业的持续升级,以及国际市场的不断开拓,都在为企业发展打开新的空间。腾讯也愿意以数字技术,为大家提供持续的增长助力。

第一个增长助力,是以AI实现产业的提质增效。

最近,DeepSeek的开源与深度思考的突破让大家都很兴奋。它给大模型带来的绝不只是评测多跑了几分的“量变”,而是里程碑式的“质变”。用户在实际使用过程中,切实感受到了AI的“可用性”在进一步提升。AI正在跨过产业化落地的门槛,站在普及应用的全新节点上。行业由之前的模型训练主导,发展到今天更多是应用与Agent驱动;我们看到,云上DeepSeek API调用量激增,语音交互的需求也带动了ASR(自动语音识别)与TTS(文本转语音)模型的API调用;模型推理的算力消耗正在高速增长,规模化推理的成本优化,成为云厂商的核心竞争力。

首先,腾讯在模型研发持续投入,全力夯实多个模型底座,满足不同场景的需求。

大模型技术是智能AI应用的基础。腾讯一方面坚定不移的推进大模型的全链路自研,另一方面,也积极拥抱先进的开源模型,让客户针对不同场景自由选择,满足各自对场景与性价比的要求。

2023年,腾讯推出了腾讯混元大模型,率先采用MoE架构,旗舰模型参数规模达万亿级,在各类行业测评中,无论是通用基础能力,还是专业应用能力,都稳居国内第一梯队;还有多个规格的蒸馏模型,在开源社区也深受开发者欢迎。

今年,我们又推出新一代快思考模型混元Turbo S,对大多数通用任务,实现“积极响应”,首字时延降低近一半。此外,更擅长完成复杂任务、深度推理的混元T1模型,也即将推出正式版。在多模态领域,混元全新上线并开源“图生视频模型”,用户只需要上传一张图片,输入创意描述,就可以生成一支自带音效、具有2K分辨率的5秒高清短片。

其次,在AI应用方面,我们坚持“用户为先”,将AI与多元场景深度融合,打造高可用、高稳定的AI应用,为用户带来“有用、好用”的智能体验。

大模型是AI应用的核心,但好的模型还需要搭配实用的场景、权威的内容来源、稳定的算力服务,才能在用户需要的时候,提供可靠的AI服务。

从用户需求出发,是腾讯的产品价值观。春节过后,用户迫切期望用到深度思考的推理能力,我们也快速响应用户需求,无论是面向C端的腾讯元宝、微信搜一搜、ima、地图等应用,还是面向开发者的大模型知识引擎、腾讯云AI代码助手等平台工具,都支持腾讯混元和DeepSeek的“双模调用”。

例如腾讯元宝,借助腾讯云智算强大的算力支撑与海量的运维经验,确保了用户使用过程流畅“不卡顿”。同时,叠加了自身积累多年的多模态能力,元宝能够对用户发送的图片做分析理解与优化处理。元宝利用了全网最优质的微信公众号内容,以及强大的“联网搜索”能力,确保了检索和生成结果的质量和时效性。最近,元宝还与腾讯文档打通,用户可以直接上传腾讯文档到元宝,让AI辅助总结、提炼要点,也能一键导出对话到腾讯文档,随时修改、分享或者继续创作。

如果模型是“大脑”,知识库也许就是“课本”。大脑智商再高,如果没有相应的知识做基础,也无法很好地解决问题。我们可以通过智能工作台ima,将模型与个人知识库融合,助力高效的工作和学习。用户基于本地文件、公众号文章等内容,构建个人和团队共享知识库,就能够实现对个人资料的精准检索、高质量的AI问答,辅助文本创作等。

企业同样可以将大模型与企业知识库结合,打造更懂业务的AI,让AI助力营销、客服和研发,提高市场竞争力。最近,腾讯乐享就上线了AI知识库功能,将深度思考与企业专属知识结合,获得了更强大的智能问答能力,为企业缩短新员工培训时间,提高员工专业水平,提高客户满意度,最终提高销售转化率。

除了腾讯乐享,还有腾讯会议、企点智能客服、AI 代码助手等,也都全面接入了深度思考的能力,为企业客户带来了更智能的使用体验。腾讯云自身就是这些产品的深度用家,边用边迭代。

例如,腾讯云AI代码助手,代码生成准确率提升30%以上,它支持上百种编程语言,能够完成代码补全、技术对话、代码诊断、单元测试等任务,已经落地了上百家数字化企业。

我们看到,很多企业也需要将大模型做进一步定制,结合企业自身的场景与数据,训练出自己的行业大模型,打造企业级的AI中台,让数据可以统一管理与复用,支撑在生产、销售和服务等环节的智能应用。

为此,腾讯推出了腾讯云TI平台,帮助开发人员一站式完成混元、DeepSeek、Llama等主流模型的精调与推理,覆盖数据获取、处理、模型训练、评估、部署到应用的全流程,数据标注成本下降70%,模型训练效率提升30%,同时还支持公有云、私有化及专属云部署。

另外,腾讯云大模型知识引擎,通过提供RAG(文件检索)、Workflow(工作流)、Agent等多种应用开发方式,来加速大模型应用的落地。企业可以获得稳定和精确的多模态知识问答效果;也可以用“拖拉拽”的简单方式,编排企业专属的工作流,快速搭建符合实际场景需要的大模型应用。

头部物流集团DHL就使用大模型知识引擎,编排了41条企业专属的工作流,快速搭建适合物流场景的智能服务,用AI自动接待客户,并完成查询快件、修改地址和时间、咨询保险和寄送等服务。更重要的是,通过工作流的模式,一线业务人员也可以直接配置智能服务,大幅降低了技术门槛和沟通成本。

目前,腾讯云大模型已在政务、零售、金融、工业、医疗、教育、文旅等30多个行业落地。

在推动模型应用落地产业的过程中,算力也非常关键。我们通过整合高性能计算、存储、网络、加速套件、云原生智能调度编排等能力,推出了腾讯云智算套件。模型训练的千卡日均故障率,仅为业界水平的三分之一;千卡集群训练的并行加速比达到96%,通信时间占比缩短到6%。此外,通过软硬件技术能力的整合,腾讯云智算集群从机器上架到开始训练,最快只需要1天。

当然,除了AI之外,腾讯运营多年的互联网服务,已经打磨出稳定与高性价比的基础设施服务,数字化技术如操作系统、云原生、网络安全等软件也全面开放给更多行业的客户。

国产软件企业也从早期侧重应用开发,逐步向更底层、更基础的平台技术扎根,技术水平与国外头部企业对齐,兼顾到国内外团队的需求与习惯,提供更高性价比、更及时响应的服务体验。

腾讯打造了以“6T”为代表的“全栈自主创新企业级软件”,覆盖数据库TDSQL、操作系统TencentOS、专有云TCE、PaaS平台TCS、大数据TBDS、AI开发平台TI,核心产品不仅通过了国家安全测评的最高标准,而且产品的兼容性、易用性和扩展性在市场上很受欢迎。比如协同办公领域,腾讯会议、企业微信、腾讯文档、腾讯乐享等应用,不仅稳定易用,而且有独特的C2B连接能力,在多个行业头部客户渗透率,都超过了50%。

无锡地铁集团就借助TencentOS操作系统,成功实现了50多个业务系统、400多套操作系统的国产化替换升级,通过底层系统的统一管理、协同变更,为全量的生产和管理信息系统打下坚实的支撑。值得一提的是,在替换过程中,我们实现了系统的“热迁移”,业务几乎0中断,用户全程无感知,成为轨道交通行业操作系统国产化标杆。

在AI和数字化融合创新的同时,我们也看到,新市场的拓展也成为了企业增长的重要驱动因素,国际化发展成为行业共识。在华东,特别是上海,很多企业都有出海的诉求,还有大量的外企,也希望分享中国大市场机遇。腾讯云也以数字化助力企业全球化发展,开拓增长新空间,在金融、泛互、媒体、游戏、电商等30多个领域,服务了10000多家海外客户,覆盖欧美、日韩、东南亚、中东、非洲等80多个国家和地区。

一方面,我们持续打造覆盖全球、稳定可靠的云基础设施,为企业国际化铺好宽平大路。例如在广汽出海的过程中,我们帮助埃安快速部署了面向东南亚地区的数字基础设施,成功复制“智能网联云平台”,3个月内完成了在泰国市场的车联网量产落地。很多客户反馈说,腾讯云在产品适应性、性价比和贴身服务等方面,都更有优势,成为大家出海的首选。我们持续加大一带一路市场的投入,在印尼的第三个可用区,与在沙特阿拉伯的数据中心也即将上线。

另一方面,中国互联网行业三十年的创新发展,所沉淀的经验和能力,也越来越受到全球客户的认可。最近,在泰国市场,正大集团旗下零售公司CP AXTRA,就把主要的零售及批发业务系统,成功迁至腾讯云。未来还将借助腾讯云的大数据解决方案,开展零售流程中的库存和需求预测、定价、促销等场景的数据应用,实现经营提效和商业增长。此外,很多欧美日韩企业,包括法国电信、日本万代、韩国网石、Coupang等众多当地的行业头部企业,也在广泛采用腾讯云的全球化资源、音视频、CDN、网络安全以及小程序框架等,服务全球用户。

各位领导、各位嘉宾!

我们正在共同见证数字技术为各行各业注入新动能。从大模型驱动的智能转型,到自主创新的国产软件崛起;从国内市场的数字化深耕,到扬帆出海开拓全球市场,腾讯云始终与千行百业并肩前行,成为企业最坚实的数字基石。

今天,我们不仅提供前沿技术,更传递一种信念——在这个充满不确定的时代,唯有锚定技术创新、开放协作、专注价值,才能将挑战转化为机遇,将焦虑升华为破局的力量。让我们携手并进,在数字浪潮中书写更多的辉煌!



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

科技守护餐桌:AI会是餐饮业的终极答案吗?

烹饪界传统上是艺术和人类技能的天地,但随着人工智能 (AI) 日益影响餐厅运营和用餐体验,烹饪界正在发生巨大变化。

美国国家餐饮协会的报告显示,40%的餐厅经营者计划在未来两年内加大对技术的投资,这表明行业正朝着以AI为代表的技术解决方案迈进。


随着餐饮业面临不断变化的顾客期望和高效运营的需求,创新型厨师和餐厅老板开始拥抱AI技术。AI不仅能激发创造力、简化流程,还能在竞争激烈的市场中提供卓越的服务。

AI正从未来概念转变为现实工具,彻底改变餐饮业的运作方式,从定制菜单到自动执行复杂的厨房任务,无所不能。

01.AI菜单:个性化与口味预测

AI在烹饪领域最引人注目的应用之一是菜单设计。

传统的固定菜单正被AI算法取代,这些算法能够分析大量关于顾客偏好、饮食趋势、季节性食材供应甚至地方口味的数据,从而打造灵活且个性化的用餐体验。

AI菜单设计概念

这些智能系统可以预测热门菜品,推荐新的风味组合,并根据顾客反馈和库存情况快速调整菜单。

麦肯锡公司的一项研究发现,采用数据驱动个性化服务的企业销售额增长了10%至15%,这显示了AI优化菜单在餐饮行业中潜在的财务优势。

想象一下,菜单能根据你的饮食需求和历史订单动态调整,推荐你可能喜欢的菜品。AI正在将这一设想变为现实。通过学习顾客的互动和点餐历史,AI可以推荐符合个人口味的菜肴,从而大规模实现定制化用餐体验。

此外,AI还能分析社交媒体趋势和在线评论,发现新的饮食偏好,帮助厨师紧跟潮流,创作出符合当下口味的菜品。

这种基于AI的创新菜单设计方式,使餐厅能够更好地应对市场变化,并持续改进菜品,以满足甚至超越顾客的期望。这种预测顾客需求的能力,正成为快速变化的餐饮行业中一项关键优势,让餐厅能够每次都能满足并打动顾客。

02.自动化厨房运营:效率与烹饪精准度

除了菜单设计,AI在厨房运营中也取得了显著进展。AI驱动的自动化厨房系统正在改变食物的准备、烹饪和库存管理方式,从而提升效率和烹饪精准度。

机械臂和AI驱动的烹饪设备可以处理日常任务,如切菜、烤汉堡,甚至制作复杂的菜肴。这让厨师能够专注于创意菜单开发和品质把控。

自动化厨房

IMARC集团的报告估计,食品机器人市场在2024年已达到27.1亿美元,预计到2033年将增长至62.9亿美元,2025年至2033年的复合年增长率为9.32%。

这种自动化技术有助于解决餐饮行业普遍面临的劳动力短缺问题,同时确保食品制作的一致性和速度,这对维持顾客满意度和企业盈利能力至关重要。

AI系统还在优化库存管理方面发挥作用。它们根据历史销售数据和预订情况预测所需食材,从而减少食品浪费,确保餐厅始终备有满足需求的食材。

配备AI传感器的智能烤箱和烹饪设备可以精确控制烹饪温度和时间,确保菜品质量一致并减少烹饪失误。

这项技术还被应用于洗碗和清洁机器人,进一步实现厨房任务的自动化,让员工能够专注于需要人类技能的工作,如摆盘、装饰和直接与顾客互动。这些AI工具是提升厨房运营效率和整体表现的重要一步。

03.机器人服务员与个性化服务

AI的应用也延伸到了前厅运营中,尤其是机器人服务员的引入。

虽然机器人并未完全取代员工,但它们被用于辅助送餐、点单和处理支付等任务,特别是在快餐和休闲餐厅中。这些机器人可以在繁忙时段提高效率,缩短等待时间,并为顾客提供新颖有趣的用餐体验。

研究表明,76.6%的人如果发现机器人服务员易于使用,会更愿意接受它们。此外,75.6%认为这些机器人有帮助的消费者表示它们易于互动,这表明明确的好处使其更受欢迎。

与此同时,AI通过数据分析实现个性化服务,使餐厅能够预测顾客需求和偏好,提供定制建议,并营造更加贴心和个性化的用餐氛围。AI驱动的聊天机器人和虚拟助手还通过在线平台和移动应用改善顾客互动,处理预订、解答问题并提供即时支持。

机器人服务员

这些数字工具不仅方便易用,还让顾客能够随时联系餐厅并快速获得解答。从这些互动中收集的数据为餐厅提供了宝贵的顾客偏好和行为洞察,进一步优化了个性化服务策略。

尽管人际互动在餐饮服务中仍然重要,但AI通过提供高效、个性化和无缝的服务,正在提升用餐体验,这满足了现代顾客对速度和便利的需求。人与AI的结合正在塑造餐饮业客户服务的未来,为顾客创造一个更加响应迅速且令人满意的用餐环境。

04.商业技能的重要性

随着AI在餐饮领域的广泛应用,未来的餐饮业将更加高效、个性化和创新。那些战略性地使用和整合AI技术的餐厅可能会占据优势,提升运营效率、顾客体验和盈利能力。

然而,驾驭这一技术变革需要深厚的烹饪知识和商业管理能力。这正是金融MBA对希望在行业中脱颖而出的厨师和餐厅老板至关重要的原因。

MBA课程可以为餐厅老板提供宝贵的资源,涵盖财务管理、市场营销、领导力和业务增长等方面的专业知识,并提供强大的职业网络支持。它还能为烹饪专业人士提供必要的信息,帮助他们在业务中明智地应用AI技术。

尽管MBA的成本和时间投入较高,但其长期收益可能远超这些挑战,尤其是对于那些希望扩展业务、开设连锁店或获得投资者资金支持的人来说。

05.餐饮业的未来

随着AI改变餐饮行业,成功的关键在于平衡创新与人性化服务。虽然技术提升了效率和个性化,但理解其财务影响,从初始成本到长期回报,对于可持续增长至关重要。

将烹饪热情与扎实的商业知识相结合,行业领导者可以确保AI驱动的技术进步不仅带来实际的商业利益,还能提升用餐体验。

原文来源于:
1.https://www.feast-magazine.co.uk/hospitality-2/chefs-bet-big-on-artificial-intelligence-to-revolutionize-dining-53289
中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DeepSeek真帮黄仁勋了,你们怎么不信呢?

文章来源:直面AI

图片来源:由无界AI生成
图片来源:由无界AI生成

北京时间3月19日凌晨,站在圣何塞GTC大会的舞台上,连黄仁勋自己都调侃:GTC是AI届的超级碗。

几周以来,外界已经对黄仁勋在GTC的演讲万分期待。


这个演讲可不好做,在DeepSeek的冲击之下,英伟达今年的股价已经下跌了12%。

这不再是发布新产品,高喊AI就是未来就可以完成任务的演讲,今年,黄仁勋需要回答很多问题。

而这场持续了两个半小时的演讲也的确和往年有很大的不同,黄仁勋在一开始就花了很长的时间去解释为什么推理时代缩放定律没有死、为什么英伟达依然非常重要。

而后,他不仅拿出了Blackwell的超大杯产品,还透露了下一代芯片,甚至下下代架构,时间一直蔓延到2028年。压轴出场的,则和黄仁勋勾画的AI发展路线图中的最后一站“物理AI”相关。

黄仁勋拯救了英伟达股价吗?至少从当日来看,截至收盘英伟达股价跌了3.43%,总市值缩水至2.82万亿美元。

到底是市场还需要几天时间消化,还是黄仁勋“游说”失败,还得等等看。

演讲要点:

  1. 发布超大杯Blackwell Ultra,性能提升1.5倍。
  2. 下一代AI“超级芯片”Vera Rubin,计划2026年底推出,并透露下下代芯片架构为Feynman,计划2028年推出。
  3. AI工厂的操作系统Dynamo,推理框架,资源利用最大化,搭配Blackwell强上加强。
  4. 推出“AI超级电脑”DGX Spark、DGX Station,提高本地运行大型AI模型的能力。
  5. 宣布网络组件的最新动作,推出Spectrum X和Quantum X交换机。
  6. 发布首个开放式人性机器人基础模型Isaac GROOT N1;并宣布与谷歌DeepMind和迪士尼研究院合作开发Newton开源物理引擎。

01、现场“开课”,

黄仁勋:你们真的都搞错了

自从号称训练只用了几百万美元的DeepSeek推理模型问世,世界就没有停止对英伟达的质疑。

起先,黄仁勋不语。然后,他开始发声,在采访中和财报会议上表示推理时代仍然需要大量计算,仍然需要英伟达的力量。

这次,他终于把这点摊开揉碎地说明了一番。

在发布会上,老黄拿出例子,让Llama3.3(LLM的代表)和DeepSeek R1(推理模型的代表)回答同一个问题:

“在我的婚礼上,需要7个人围坐同一桌。我的父母和岳父岳母不能挨着坐。此外,我妻子坚称她在我左手边的话,拍照更好看。同时,我需要坐在伴郎身边。我们怎么安排座位?如果我们邀请牧师和我们坐一起呢?”

看完这个问题,大部分人可能已经头大了。要回答它,不仅要识别其中包含多少个不同的需求,还要同时满足所有需求。有意思的是,最后又有一个进一步的问题,需要先回答主问题再补充这个问题的答案。

Llama 3.3非常简单粗暴,回答得很快,只用了439个tokens。但是,它的回答并不正确,未能满足所有要求。快、省但对于提问的人来说无用。

DeepSeek R1则反复思考,尝试了很多可能,反复检验答案,最终消耗了8559个tokens,才最终给出了答案。时间久,消耗大,但是给出的答案准确。

图片示例1

而每一个token生成的背后,都是整个模型的加载。推理模型更复杂,也就需要更多地计算。DeepSeek R1的参数规模达到6800亿,下一代有可能达到数万亿参数规模。

两相对比,DeepSeek R1比Llama 3.3多生成了20倍的tokens,计算需求高出150倍。

大模型推理是一种极限计算。”老黄表示。

通过这个对比,老黄很直观地告诉大家:推理模型也许预训练的时候消耗少,但推理起来可是实打实的吸金兽啊。英伟达GTC的官方博文中,把Tokens视为AI的语言和货币。

“去年,关于扩展定律Scaling Law,全世界几乎都预测错了。”老黄在台上再次强调。他进一步指出,如今扩展定律从一个变成了三个:预训练、后训练(微调)和推理。

图片示例2

那英伟达在推理时代要做什么呢?两方面:一方面,让芯片能在单位时间内处理更多tokens,另一方面,让单位算力的成本和能耗降低。

黄仁勋此前就在财报会议上表示,Blackwell就是为推理而生的,这次演讲中在说清楚推理模型为什么需要更多算力之后,黄仁勋也拿出图表,展开讲了讲这一点。

以Blackwell和Hopper做对比,都是1兆瓦功耗,Hopper数据中心每秒生成250万tokens。Blackwell数据中心提高了25倍,如果是推理模型,则比Hopper好40倍。

图片示例3

这让图表中出现了一个向上鼓的曲线,这个曲线正是黄仁勋想让各位AI制造商关注的“赚钱要点”。

图片示例4

黄仁勋称,成本是AI输出的token,收益就是用户获得的token。如果纵轴是前者,横轴是后者,横轴扩张更多时——也就是收益比成本扩张更多时——一个漂亮的利润弧线就出现了。

图片示例5

为了强调Blackwell是为推理而生这一点,老黄甚至不惜“拉踩”Hopper,称:“当Blackwell开始大量出货的时候,就算你送Hopper,别人基本也不会要的。”

以前老黄总说,(英伟达AI芯片)买得越多越省钱,现在他更进一步,告诉大家,买得越多越赚钱。

02 软硬兼施,

Blackwell超大杯与“AI工厂操作系统”Dynamo

花了40分钟讲明白为什么英伟达依然能打,为什么说Blackwell是为推理而生之后,黄仁勋当然还得说说新产品。

首先是Blackwell Ultra,专为AI推理时代而打造,Ultra的后缀大家也不陌生了,超大杯。

“我们专为这一刻设计了Blackwell Ultra,一个多功能平台,(利用它)可以高效地进行预训练、后训练和推理。”

其中GB300 NVL72在一个机架规模设计中连接了72个Blackwell Ultra芯片,并包含36个基于Arm Neoverse的Grace CPU。较上一代性能提升1.5倍,与Hopper相比收入潜力提高50倍。还是以DeepSeek R1为例,老款Hopper运行这个模型时每秒只能处理100 tokens,而GB300 NVL72每秒能处理1000 tokens。

图片示例6

这意味着用户获得回答的速度大大提高。

而HGX B300 NVL16系统相比于Hopper一代,推理速度提升11倍,计算能力提升7倍,内存大4倍。

英伟达一直都有软硬兼施的策略,此前也针对自家的芯片做了不少优化(不过,DeepSeek的开源周展示的一些优化甚至比英伟达还强),这次黄仁勋也同步官宣了开源推理框架Dynamo。

黄仁勋将之称为“AI工厂的操作系统”。这样说可能有点抽象,具体来说,Dynamo像一个交通指挥官,帮助GPU之间实现更好的通信。对思考和生成可以进行独立优化,高效利用资源。如此一来,(还是回到演讲开头强调的token问题上)每秒就能产生更多token了。

不过,黄仁勋也表示,Hopper虽然也可以用Dynamo优化,但是效果不会那么明显。

为推理而生的Blackwell再加上为推理优化而生的Dynamo,就是强上加强,DeepSeek R1的吞吐量一下提高30倍。

03 下一代更好

2028年还不够远,黄仁勋勾勒AI发展路径图

除了现在,黄仁勋当然还得谈到未来。

英伟达下一代AI芯片Vera Rubin首次走到台前,黄仁勋介绍,该名称来源于天文学家Vera Rubin(以暗物质研究著称)。

其中CPU Vera内容容量是前代的4倍多,内存带宽是前代的2倍多,而GPU Rubin讲配备299GB的HRM4。

用老黄的话说就是“几乎所有细节都是新的”。

图片示例7

这一代Grace Blackwell(GB)将在今年下半年发货,Vera Rubin将在2026年下半年发货。

黄仁勋也预告了Vera Rubin的超大杯,Rubin Ultra,对比GB300性能提升13倍,预计2027年下半年发货。

除此之外,连Vera Rubin之后的下一代AI芯片架构也被揭露,它被命名为Feynman,这个名字同样取自于一位科学家,对量子计算领域有突出和贡献的Richard Phillips Feynman。黄仁勋预告,Feynman甲沟将于2028年登场。

此外,值得注意的是,在演讲一开始,黄仁勋给出了AI的发展路线图,从2012年深度学习突破的起点AlexNet开始,经历Perception AI(感知AI,这个阶段AI主要用于理解数据,如识别语音、图片等)、Generative AI(生成式AI,也就是现阶段的以ChatGPT为代表的技术)。

图片示例8

接下来,已经看到苗头的是Agentic AI(代理AI),从简单的数据生成到执行任务。

而最终,AI的终极目标是Physical AI(物理AI),实现从软件到硬件、从虚拟到现实的跨越。让AI具备物理行动能力,如机器人和自动驾驶技术的发展。

英伟达作为AI计算的核心玩家,显然希望引领这一进程。

对物理AI这部分的具体展开,在黄仁勋的此次演讲中占比并不算高,但作为压轴出现,足见其重要程度。

舞台上出现了《星球大战》中的小机器人Blue,它在舞台上走来走去、摇头晃脑,看起来充满好奇心,不得不说看起来就非常灵动。

图片示例9

这个机器人搭载了英伟达Isaac GR00T N1,号称是全球首个开源且完全可定制的人性机器人基础模型。模型包含双系统架构,一个系统负责快思考,另一个负责慢思考。据英伟达介绍,该模型能轻松掌握抓取、移动等复杂人物。

图片示例10

与此同时,黄仁勋还宣布正在与谷歌DeepMind和迪士尼研究院合作下一代开源仿真物理模型Newton,专为机器人开发而生。

“通用性机器人的时代已经到来。”

04 老黄委屈,

英伟达推出好产品还远远不够

英伟达的高速增长也一直伴随着“泡沫”担忧,很长的一段时间,这家公司不断推出新的产品,但市场波动时有发生。很多次财报发布时,明明业绩全线飘红,黄仁勋也大表信心,股价还是会抖三抖。

“我们发了新东西,但人们立刻就会说,好,然后呢?这放在任何公司身上都不是正常都。”

这次,黄仁勋很少见地在GTC的舞台上倒了点苦水:“这不是买个笔记本电脑”。他表示,这既需要计划,也需要资源和人,规划是以几年为计的。

也许这也解释了为什么黄仁勋这次演讲持续了两个半小时(去年不到两小时),为什么他一口气掏出这么多成果,为什么AI芯片连2028年的下下代都透底了,为什么在最后拿出了AI发展路径的最后一站“物理AI”的最新成果。

老黄这次该讲的、能讲的都讲了,尽力了。

至于人们还会不会问“然后呢”,他也管不了了。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

又走一位合伙人!高管们集体「逃离」百川智能

王小川的AI创业合伙人们,陆续离开了他。

近日,百川智能被曝联合创始人焦可已经离职,联合创始人、模型研发负责人陈炜鹏即将离职。


对于这些消息,百川智能方面选择保持沉默。

新浪科技从知情人士处了解到,陈炜鹏管理着百川超过一半的研发人员,但公司聚焦医疗战略及内部激烈的资源竞争,其主动提出了离职,目前正等待百川智能内部放行。

此外,金融To B业务的负责人——百川智能商业合伙人、金融事业群总裁邓江,虽未官宣离职,但也已经离开,下一步或将加入一家大模型创业公司。

加上去年12月,联合创始人、商业化负责人洪涛也选择了离开。细数下来,在最近三个月以来,已出现三位联创及合伙级高管离职,另一位“等待离职中”。

二次创业仍拢不住人心,王小川和百川智能,究竟怎么了?

内斗或加剧高管们“出逃”

据知情人士近日爆料,“百川智能创始团队近期出现变动,其中,主要负责互联网业务的联创焦可已经离职,另一位主要负责百川大语言模型技术的联创陈炜鹏也将离职,目前还在走内部流程。”

据悉,焦可和陈炜鹏两人都已经分别开始AI领域创业。其中,焦可在AI语音方向创业,且正在寻求融资。陈炜鹏的创业项目为AI Coding方向,同样也在陆续接触一些投资人。

对于上述消息,百川智能方面至今未做回应。新浪科技曾向陈炜鹏本人求证相关消息是否属实,但对方未做回应。

不过,有知情人士对新浪科技透露,“陈炜鹏此次离职系本人主动提出,如果百川通过离职请求,很快就会离开。”

该人士进一步透露称,“陈炜鹏其实在百川负责基础大模型,管理着公司一大半的研发人员,是百川绝对的核心技术领导人。但是,由于2024年,百川内部爆发过激烈的人才、资源争抢,处于旋涡重心的陈炜鹏也深受其累,“主动提出离职”。

对于具体为何会发生人才和资源争斗,该人士并未直言。不过结合坊间传闻及百川智能近期动态,大致可以推测为百川进一步聚焦医疗战略,资源向医疗集中,进而导致内部分歧。

本月初,百川智能传出主要负责金融行业To B业务的B端组被裁撤,员工均在当天签署离职协议。据彼时百川智能方面回应新浪科技,“百川正按照既定规划,对金融业务进行优化调整,以集中资源、聚焦核心业务,加速实现“造医生、改路径、促医学”的愿景。”据彼时员工透露,“未来百川将以更高效的团队和更丰富的资源,推动优质医疗服务的普及与普惠。”

该公司内部人士表示,结合陈炜鹏被曝正筹备AI Coding方向创业项目来看,陈炜鹏本人对于AI医疗的兴趣或许没有那么浓厚。与王小川认定的公司战略方向不太一致,主动提出离职,或许也是不得已为之。

除了焦可和陈炜鹏外,知情人士还透露,本月初百川智能金融行业To B业务B端组调整的力度极大,目前整个组均已裁撤,之前负责该业务的百川智能商业合伙人、金融事业群总裁邓江,目前也已经离职。

至此,王小川的AI高管们,已有三名联合创始人离职,一人已经提离职等待批复中。

百川的步调乱了?

2024年7月,百川智能曾宣布完成A轮50亿元融资,同时将以200亿元估值开启B轮融资,成国内第三家估值200亿元大模型独角兽。在A轮融资中,百川的投资方包括阿里、小米、腾讯、亚投资本、中金等头部大厂和市场化投资机构,也有北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产投基金。

去年还备受资本热捧的百川智能,缘何今年却忽然战略大转,多位高管陆续被曝离职?

资深AI行业人士李谋(化名)对新浪科技直言:“主要还是受到了DeepSeek的冲击”。李谋认为,“DeepSeek有着不弱于国内任何一家企业的AI infra能力,但他们却选择了开源路线,这直接击穿了各模型厂商的技术护城河,在AI infra能力比不过DeepSeek的情况下,大模型厂商想要在模型方案等B端业务上超越DeepSeek,唯有从算力和数据层面入手,算力比拼的是资金和GPU采购能力,唯一能做出差异化的,其实更多的是数据。”

“医疗行业足够大,这一领域的数据壁垒也很高,如果百川真的能够扎进去,发挥自己的模型能力同时构建起自己的数据壁垒,确实会有非常多的想象力”,在李谋看来,相比AI+金融领域目前已经布满大厂、各类创企,竞争已经非常激烈,AI与医疗的结合目前业务成熟的企业还不太多,但“健康长寿”的诱惑力又足够大,仍能够吸引资本为其不断买单。

但是,作为AI 1.0时代的“AI四小龙”们,很早就看到并进行布局,随后又陆续放弃的领域,王小川的AI+医疗新故事,又能够坚持多久?

以去年底刚上市的AI+医疗行业头部公司讯飞医疗为例。在2024年上半年,其账上还有着1.34亿元的亏损,且相较同期,亏损数额还在进一步扩大。行业头部企业尚且吃不上肉的情况下,急着聚焦医疗的百川智能,在大多数人看来更像是“步调乱了”。

据百川智能内部人士透露,公司不会放弃基础大模型研发,后续将会做医学增强的基础大模型。从长的时间线来看,AI与医疗的结合是王小川的理想、星辰大海,他甚至可以围绕AI怎么攻克癌症、衰老进行布局,对于早已财务自由的他,可以有耐心去追求自己的情怀,但他身边的人,又有多少能一直陪着他“做时间的朋友”?



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI如何重塑全球生物多样性研究,麦吉尔大学最新综述

编辑 | 2049

在全球生物多样性快速丧失的背景下,准确理解和监测生物多样性变化显得尤为重要。

目前全球约有 870 万种真核生物,但仅有约 200 万种得到正式描述。


即便是已知物种,我们对其分布、种群动态、生态功能等认知也存在巨大空白。

最近,由麦吉尔大学(McGill University)和匹兹堡大学(University of Pittsburgh)牵头,联合麻省理工(MIT)等多家研究机构的团队发表了一篇综述,系统探讨了人工智能(AI)技术如何帮助克服这些认知障碍。

论文不仅系统总结了 AI 在生物多样性研究中的现状,还为跨学科合作指明了方向,对推动生物多样性科学发展具有重要的指导意义。

该研究以“Harnessing artificial intelligence to fill global shortpositions in biodiversity knowledge”为题,于 2025 年 2 月 20 日发表在《Nature Reviews Biodiversity》。

图片

论文链接:https://www.nature.com/articles/s41467-025-56733-w

生物多样性认知短板

生物多样性监测与保护长期受限于数据获取与分析能力,自 1980 年代起,生态学界逐步确立困扰大规模生物多样性知识的七大不足:

Linnaean(分类描述)、Prestonian(丰度的估计和模式)、Wallacean(生物地理物种分布)、Hutchinsonian(非生物耐受性和基本生态位)、Raunkiaeran(功能性壮变异)、Darwinian(进化关系)和 Eltonian shortfalls(物种相互作用)。

图片

图示:生物多样性知识的七个不足。(来源:论文)

这些系统性缺陷严重制约着《昆明-蒙特利尔全球生物多样性框架》(GBF)2030 年目标的实现。

相关链接:https://www.cbd.int/gbf

传统监测手段在物种分布追踪(Wallacean 缺口)和种群动态监测(Prestonian 缺口)方面存在时空分辨率低、覆盖范围有限等缺陷,而新兴传感器网络产生的多模态数据(图像、音频、DNA 等)亟需新型分析方法。

AI 技术特别是深度学习(Deep Learning)在计算机视觉(Computer Vision)和自然语言处理(Natural Language Processing,NLP)领域的突破,为整合异构数据、提升生态模型预测能力提供了新范式。

图片

图示:人工智能在填补生物多样性知识空白和下游应用方面的潜在作用。(来源:论文)

技术路线演进与核心挑战

当前人工智能(AI)在生物多样性研究中的技术进展主要体现在三个方面:基于传感器网络的自动化监测系统(如无人机与声学记录仪)、多模态数据融合建模(整合图像、DNA与遥感数据),以及生物性状量化分析(如形态与功能性状提取)。

在物种识别领域,视觉语言模型(Vision-Language Models,VLMs)通过跨模态对比学习,成功实现跨物种图像特征提取,展现出在大规模分类任务中的潜力。

联合物种分布模型(Joint Species Distribution Models,JSDMs)则突破传统单物种建模局限,整合卫星遥感、环境 DNA(eDNA)和公民科学观测数据,显著提升了物种分布预测的空间精度。

然而技术演进面临三重核心挑战:

  1. 长尾分布困境——稀有物种在训练数据中占比不足,导致模型在实验室与野外场景的识别性能差异显著;
  2. 地理泛化瓶颈——模型在不同地理场景下的性能衰减显著;
  3. 生态语义隔阂——现有机器学习框架难以编码种群动态方程等生态过程机制,限制了其在生态研究中的应用。

关键技术突破与验证

突破性进展体现在多模态融合与知识引导学习领域。

  1. 多模态数据融合——基于对比学习框架的多模态模型,通过联合编码 DNA 条形码与显微图像数据,显著提升了物种分类的准确性。这种方法在生物多样性研究中展现了跨模态表征对齐的潜力,特别是在处理复杂数据集时表现出色。

  2. 生态网络建模——在 Eltonian(物种相互作用)研究中,图神经网络(Graph Neural Networks, GNNs)被用于构建生态网络模型,能够更准确地预测物种相互作用关系。相比传统方法,GNNs 在捕捉复杂生态网络结构方面表现出更强的能力。

  3. 种群动态预测——整合机理知识(如 Leslie 矩阵)与数据驱动模型(如 LSTM)的混合方法,在种群动态预测中表现出更高的稳定性和准确性。这种方法不仅提高了模型的预测精度,还增强了模型在长时序预测中的可靠性。

开放问题与未来突破方向

基础模型(Foundation Models)的生态适配性成为攻坚重点:

  1. 机理-数据融合架构——将 Lotka-Volterra 方程等生态动力学模型嵌入递归神经网络(Recurrent Neural Networks, RNNs),在生态系统模拟中展现出潜力,显著提升了长期预测的稳定性和准确性。

  2. 小样本学习范式——基于元学习(Meta-learning)的 Few-shot 分类器在小样本生物多样性监测中表现出色,为稀有物种的跨区域识别提供了有效解决方案。

  3. 边缘计算部署——轻量化模型在智能相机陷阱等边缘计算设备中降低了功耗,但在热带潮湿等极端环境下的设备适应性仍需进一步优化。

未来应优先开发动态过程感知模型(dynamic process-aware models),通过同化卫星影像、声学传感器网络和 DNA 元条形码等多模态数据流,构建濒危物种栖息地选择的实时反馈系统,实现栖息地适宜性预测的动态更新,为自适应保护决策提供量化依据。

在遗传多样性缺口监测中,纳米孔测序(Nanopore Sequencing)与 AI 模型的结合展现了高效性,为野外实时基因分型提供了技术支持。

未来展望

AI 技术正在重塑生物多样性研究的范式,其价值不仅体现在数据处理效率的量级提升,更在于启发性发现(如通过无监督学习识别隐性生态关系)。

当前亟需建立跨学科协作平台,将生态学机理知识编码为机器学习约束条件,同时防范技术滥用风险(如物种定位数据泄露导致的盗猎风险)。

展望 2030 年,融合过程模型与 AI 的“下一代生物多样性观测网络”,有望实现从基因到生态系统的全景式认知跃迁,为全球保护决策提供实时动态支持。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

我下下决心再给老板发哈哈哈

编辑 | 萝卜皮

原子结构的高分辨率可视化对于理解材料微观结构与宏观性质之间的关系具有重要意义。然而,在原子分辨率显微镜中,快速、准确、稳健地自动解析复杂模式的方法仍然难以实现。


北京大学、厦门大学、中南大学以及深势科技等组成的研究团队,提出了一种基于 Trident 策略增强的解缠结表示学习方法(生成模型)。该方法利用少量未标记的实验图像和大量低成本的模拟图像来生成大量与实验结果非常相似的带注释的模拟数据,从而产生高质量、大容量的训练数据集。

基于残差神经网络的结构推理模型,能精准识别多种材料(如 MoS₂、WS₂ 等)在范德华界面的复杂堆叠(stack)方式,无论是双层还是三层结构,其层间滑移和旋转的测量精度可达皮米级,且抗干扰能力强,不受缺陷、成像噪声或表面污染影响。

该模型不仅能捕捉堆叠模式的渐变过渡,还能区分频域分析难以辨别的莫尔条纹,其高通量特性更揭示了范德华外延中多种热力学稳定构型的共存规律。

该研究以「Auto-resolving the atomic structure at van der Waals interfaces using a generative model」为题,于 2025 年 3 月 25 日发布在《Nature Communications》。

图片

背景

二维范德华材料通过层间扭转和滑移可调控莫尔超晶格,从而诱导超导性、铁电性等新颖物性,虽然扫描透射电子显微镜(STEM)能够解析其原子级结构,但传统人工分析方法存在效率低、误差大等瓶颈。

机器学习为此提供了新思路:无监督学习可自动聚类结构特征但解释性差,而监督学习虽精度更高却受限于标注数据——实验数据标注成本高昂,模拟数据则因与真实图像的风格差异导致质量不足,这使得当前方法仅能处理简单的分类任务(如缺陷识别)。

然而,针对连续变化的复杂问题(如皮米级层间位移或转角测量),现有方法仍面临挑战,虽有人尝试通过 CycleGAN 增强模拟数据的真实性,但其图像内容保真度不足。

因此,开发高效、高精度的监督学习框架成为关键突破方向,需在数据质量与规模之间取得平衡,并提升算法对噪声、污染等实际条件的稳健性,最终实现从「识别离散结构」到「求解连续变量」的跨越,完成复杂堆叠模式的自动化定量分析。

在最新的研究中,北京大学等机构的研究人员开发了一种 Trident 策略增强的解缠结表示 (DR) 学习方法,该方法利用一小组未标记的实验 STEM 图像和大量低成本模拟图像来生成一个大型带注释的训练数据集,该数据集与实验图像风格非常相似,并且在风格转换后严格保持模拟图像内容,从而在训练数据的质量和数量之间显示出优越的平衡。

然后利用残差神经网络对这些高质量的模拟图像进行结构推理模型训练,以端到端的方式直接输出多样化复杂堆叠模式的层间滑移和旋转,精度达到皮米级。

模型概述

具体来说(下图所示),该框架的第一步是通过解缠结表示图像到图像转换(DRIT)算法训练生成模型,该算法可以生成高质量的 STEM 模拟图像。它是通过将软件生成的低质量、无噪声模拟图像中的结构信息(例如原子的位置、亮度和大小)与实验图像中的视觉风格相结合来实现的。

图片

图示:机器学习工作流程。(来源:论文)

第二步是定义滑移和扭曲堆叠的结构描述符,以表示所有潜在的堆叠配置,然后在第一步通过训练有素的 DRIT 模型生成逼真的 STEM 模拟图像。由此获得了具有精确标记且与实验图像风格相似度高的大型训练数据集,缓解了因 STEM 实验成本高以及逐个原子手动标记实验图像效率低下而导致的数据稀缺问题。滑移堆叠的描述子是通过沿单层晶胞面内两个基矢量方向分解滑移矢量 D 得到的滑移坐标(Da,Db),而对于扭曲堆叠,则应用层间旋转角 θ。

第三步,以 ResNet-50 架构作为回归网络的主干,训练端到端的堆叠结构识别模型。通过两个 ResNet 模型分别学习堆叠结构标签,即(Da,Db)和 θ,与真实的STEM模拟图像之间的关系,从而能够从实验图像中直接、准确、高效地自动解析范德华界面处的层间滑动和扭曲。

整个工作流程的关键在于 DRIT 模型的训练,它决定着能否将大量、低成本但质量较低的 STEM 模拟图像成功转化为结构信息严格不变、视觉风格与实验图像高度相似的高质量模拟图像,从而为后续的监督学习获取大量的训练数据。

有两点需要深入理解:一是选择 DRIT 算法进行风格转换的原因;二是需要对基本 DRIT 模型进行修改才能更好地完成任务。

能力评估

该框架首先被用于解决滑移堆叠范德华双层的原子 registries 问题,这些双层具有旋转排列的顶层和底层(无层间扭曲),但在层间滑动中表现出亚埃级的差异,从而表现出各种物理特性。虽然不同滑移堆叠的结构信息被编码在其复制二维快速傅里叶变换(FFT)中,并且可以通过四维 STEM 布拉格干涉法等先进的衍射技术来解析,但对实空间高分辨率 ADF-STEM 图像进行逐原子分析仍然是最简单、最快捷的识别方法,而且对设备的要求也不高。

实验中观察到双层 ReS2 显示出多样化的滑移堆叠模式,因此研究人员选择该测试案例来评估该框架的四种能力:(i)从原始 ADF-STEM 图像中解析滑移堆叠配置,(ii)定量感知模式的细微结构演变,(iii)准确定位模式转换界面,以及(iv)有效地对大量数据进行统计分析并为创新发现做出贡献。

结果显示,他们的推理模型可以快速计算出滑移矢量坐标,随后将其自动转换为原子模型(底部面板),并根据专家知识和图像模拟验证其正确性。

研究人员使用步长为 0.05 Å 的 DRIT 生成的双层 ReS2 图像作为测试数据集,并使用欧氏距离 ∆D 来评估由步长范围为 0.1 至 0.4 Å(以 0.1 为增量)的 DRIT 生成的图像训练的不同推理模型推断的滑移坐标的准确性。欧氏距离 ∆D 表示如下:

图片

下图中的箱线图显示,随着步长的增加,平均 ∆D 和对应于中间 95% 数据的 ∆D(箱上限)都在增加,这意味着模型精度下降。考虑到推理模型精度和训练成本之间的平衡,研究人员选择 0.1 Å 的步长来构建模拟图像数据集,得到的平均 ∆D 为 0.03 Å,95% 的推断结果与真实值的偏差小于 0.05 Å,这足以应对实验图像,其空间分辨率为 ~0.7 Å。

图片

图示:滑移堆叠范德华 (vdW) 双层的自动结构分析。(来源:论文)

这个达到皮米级精度框架可以很容易地推广到测量大面积 STEM 图像中微弱的滑移堆叠位移。另外,当实验图像存在一定浓度缺陷或信噪比较低时,该模型的推理精度仍然保持稳健。

ML 框架还可以根据 STEM 图像捕获的莫尔条纹直接解析范德华材料的扭曲角,这对于理解此类超晶格的结构-性质关系至关重要。

图片

图示:滑移堆叠分析推理模型的稳健性和普遍性。(来源:论文)

该模型可以很容易地推广到滑移堆叠三层的结构分析,在这种情况下,由于结构复杂性的激增,人类专家只能通过反复试验,就像玩拼图游戏一样,来推断潜在的答案。

结语

总而言之,基于 Trident 策略增强的 DR 学习算法,解决了监督学习中的一个关键问题,即如何轻松获得高质量、大量的训练数据。

利用 DRIT 生成的高质量模拟图像训练的结构推断模型可以根据不同堆叠方式(滑移和扭曲)、层数(双层和三层)和成像状态(缺陷率、信噪比、污染)的各种材料的 STEM 图像中的堆叠模式直接、快速、准确地确定范德华界面处的原子尺度结构,并有可能扩展到其他复杂的微观结构分析。

ML 方法的自动化和高通量处理能力引起了范德华外延模式的发现,其中多种热力学有利的滑移堆叠与几乎连续的变化共存,展示了 ML 对知识涌现的贡献。

这项工作扩展了监督学习的能力,从识别离散和简单的微结构到分析复杂且不断变化的主题。机器学习方法在效率、准确性和解决问题的复杂性方面表现出优于人类专家的优势,这可能会彻底改变显微镜图像中原子结构的表征和解释模式,为快速、准确、自动和基于统计的纳米材料信息提取铺平道路。

论文链接:https://www.nature.com/articles/s41467-025-58160-3



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

一脑多机!智源的新发布,让不同机器人轻松协作

3 月 29 日,智源研究院在 2025 中关村论坛 “未来人工智能先锋论坛” 上发布首个跨本体具身大小脑协作框架 RoboOS 与开源具身大脑 RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持。

开源链接如下:

具身多模态大脑模型 RoboBrain

为机器人操作任务设计的高质量异构数据集 ShareRobot

增强长程操作任务能力 打造感知 - 认知 - 决策 - 行动闭环

图片

在具身场景中,长程操作任务是机器人执行复杂任务的核心能力之一。


具身大脑 RoboBrain 融合了机器人任务规划、可操作区域感知、轨迹预测的三维能力,通过将抽象指令映射为具象动作序列,增强长程操作任务的能力。

RoboBrain 由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA 模块和用于轨迹预测的 T-LoRA 模块。在推理时,模型首先感知视觉输入,并将输入指令分解为一系列可执行的子任务,然后执行可操作区域感知和轨迹预测。RoboBrain 采用多阶段训练策略,使其具备长历史帧记忆和高分辨率图像感知能力,进而提升场景感知和操作规划的能力。

RoboBrain 在任务规划、可操作区域感知和轨迹预测评测任务中均表现出卓越性能。

任务规划方面,RoboBrain 在不牺牲通用能力的前提下,在机器人规划评测集 OpenEQA、ShareRobot(自建)和 RoboVQA 上多个维度优于 GPT-4V、Claude3 等 6 个当时领先的闭源 / 开源 MLLMs。

图片

RoboBrain 在具身规划评测基准上的性能

可操作区域感知方面,RoboBrain 在 AGD20K 测试集上的平均精度超过了当时最先进的开源模型 Qwen2-VL,验证了其在指令理解和物体属性方面的卓越能力。

图片

RoboBrain 在可操作区域感知基准上的性能

在轨迹预测方面,RoboBrain 预测的操作轨迹具有与真实轨迹较高的相似度,展现了其在轨迹预测中的高精度和稳定性。RoboBrain 的未来迭代版本会持续提高轨迹预测的能力。

图片

RoboBrain 在轨迹预测基准上的性能

目前,RoboBrain 能够解读人类指令和视觉图像,以生成基于实时图像反馈的行动计划和评估,预测每一步的轨迹并感知相应的可操作区域。具体而言,RoboBrain 能够有效利用环境信息和交互对象的状态 —— 无论是从第一人称还是第三人称视角捕捉的图像 —— 生成针对不同类型机器人操作任务的任务规划,并基于人类指令和视觉信息,提供合理的可操作区域,并能在不同场景中表现出良好的泛化能力。

图片

具身大脑 RoboBrain小脑技能库以及跨机器人数据中枢,是跨本体框架 RoboOS 的核心要素。具身大脑 RoboBrain,负责全局感知与决策,构建动态时空感知、规划指导和反馈纠错机制;小脑技能库,负责低延迟精准执行,实现柔性与精密操作等;跨机器人数据中枢,负责实时共享空间、时间和本体记忆,为决策规划与优化协作操作提供信息支持,从而形成感知 - 认知 - 决策 - 行动的闭环。

一脑多机实现跨本体协作 从单体智能迈向群体智能

跨本体具身大小脑协作框架 RoboOS,基于“大脑-小脑” 分层架构,通过模块化设计、智能任务管理和跨本体协作,为机器人提供高效、灵活、可扩展的底层支持,实现从单机智能到群体智能的跃迁。

在 RoboOS 的分层架构下,具身大脑 RoboBrain 的复杂场景感知与决策能力,可与小脑技能库的高效执行能力深度结合,确保协作框架在长周期、高动态任务中的稳定运行。实现大脑模型(如 LLM/VLM)与小脑技能(如抓取、导航)的 “即插即用”,目前,可支持松灵双臂、睿尔曼单 / 双臂、智元人形、宇树人形等不同类型的具身本体。

通过共享记忆系统(空间记忆 / 时间记忆 / 本体记忆),实现多个机器人之间的状态同步与智能协作,突破传统 “信息孤岛” 限制,实现跨本体协作控制。

RoboOS 可动态管理多机器人任务队列,支持优先级抢占与资源优化分配,确保复杂场景下实时响应,实现高并发任务调度。

此外,RoboOS 可基于执行反馈动态调整策略,结合环境变化,持续优化任务规划,提升鲁棒性,做到实时闭环优化。

图片

基于 RoboOS 及 RoboBrain 的多机器人跨本体协作递送任务 Demo

在 “递送苹果和水果刀” 的任务场景中,基于 RoboOS 及 RoboBrain,睿尔曼单臂机器人(转运)、宇树人形 G1(挑拣水果)、松灵双臂机器人(挑拣水果刀)分工协作。

整体任务流程是睿尔曼调用 “导航技能” 移动至餐桌前,宇树 G1 调用 “视觉抓取技能” 完成指定物体的挑拣,睿尔曼调用 “抓取技能” 提起果篮并导航至松灵餐桌前。紧接着,松灵调用 “抓取技能” 获取水果刀,并放置在果篮中心,睿尔曼依据 “空间记忆” 导航至办公桌位置,递送果篮后返回。

RoboOS 接收 “拿离杯子最近的水果,并递送一把水果刀” 指令后,递送 RoboBrain 进行任务拆解,并将拆解后的子任务分发给 3 台跨本体机器人。RoboBrain 通过 “空间记忆” 感知环境,确定果篮、苹果位置,并拆解任务为 “宇树 G1 挑拣苹果→睿尔曼传递果篮→松灵机器人抓取水果刀→睿尔曼返回”。

各机器人本体执行子任务过程中,由 RoboOS 提供端云协作能力,将任务规划为技能粒度,实现云端 RoboBrain 分发规划,端侧执行技能并实时反馈。RoboBrain 识别 “离杯子最近的水果位置”、“果篮抓取位置 affordance”、“水果刀抓取位置 affordance”、“果篮空闲位置 Pointing”,经由** RoboOS 递送指导各机器人本体完成任务。**

“即插即用” 快速轻量化泛化部署 打造统一生态

RoboOS 作为面向多机器人系统的跨本体具身大小脑协作框架,专为解决当前具身智能落地过程中的通用性适配与多机调度难题而设计。针对异构本体难以统一接入、任务调度效率低、缺乏动态错误反馈机制等痛点,基于 RoboOS 的 “大小脑协同” 的架构范式,云端的具身大脑 RoboBrain 负责统一的任务理解、规划决策与上下文感知,本体侧则接入轻量级的小脑执行模块,实现感知 - 认知 - 决策 - 行动的闭环协作。

该机制能够动态感知本体差异、灵活适配操作指令、自动修复异常行为,有效提升系统在复杂任务场景下的鲁棒性与泛化性。RoboOS 原生支持异构机器人本体的灵活接入,以 Profile 模板机制快速完成机器人能力建模与适配。

本体的小脑模块可调用包括开源技能库、自研低阶控制器等多种技能接口,形成一个支持模块复用、即插即用的运行体系,大幅降低开发门槛与接入成本。

在云端,RoboOS 提供完备的模型适配与 API 接入能力,兼容自研的多模态 VLM,作为可插拔的大脑决策引擎,从而在服务机器人、工业自动化、智慧物流、智能制造等领域支撑复杂任务的多机协作需求。

借助 RoboOS 的端云一体化协同能力与动态调度机制,整个系统不仅具备高度的扩展性与可迁移性,更为未来具身智能的规模部署与生态构建奠定了通用操作系统级的基础。

图片

RoboOS 基于智源研究院研发的并行训练与推理框架 FlagScale,原生支持多机器人系统的端云协同能力,打造具身智能的统一底座。系统在设计上充分考虑 “多机器人 - 多模态 - 多任务” 场景,具备极高的可扩展性与低时延响应能力。

在端侧部署中,机器人注册即可自动与云端部署的 RoboBrain 大脑建立双向通信链路,通过高效发布 - 订阅机制实现实时任务调度与状态反馈,指令响应延迟低于 10ms,满足复杂动态任务的闭环控制需求。

面向机器人在长期运行中产生的海量感知与行为数据,RoboOS 提供基于内存优化的数据访问引擎,支持 TB 级别历史数据的内存随机访问能力,为任务复现、异常回溯、跨任务知识迁移等场景提供基础能力。结合 RoboBrain 的任务推理与策略优化模块,历史数据还可用于多机之间的协作知识共享,实现更强的智能演化与自主学习能力。

此外,FlagScale 作为底层支撑框架,支持大模型在多设备间的并行推理与多任务协同调度,可无缝集成视觉语言模型、轨迹生成模块、感知识别等子系统,全面释放具身大模型的系统潜力。

目前,智源研究院依托多模态大模型技术优势资源,正在联合北大、清华、中科院等高校院所以及银河通用、乐聚、加速进化、宇树等产业链上下游企业,积极建设具身智能创新平台,重点开展数据、模型、场景验证等研究。

此次智源研究院发布的跨本体具身大小脑协作框架 RoboOS 及开源具身大脑 RoboBrain,将有机融合和广泛链接不同构型的具身本体与丰富多元的具身模型,加速具身智能跨本体协作与规模化应用。

开放、协作、共享,是具身智能生态繁荣的必经之路,智源研究院愿携手更多产业合作伙伴,共绘具身智能生态蓝图。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

欢笑而非笔记本电脑:咖啡文化反击键盘入侵者

“去咖啡馆,那里的谈话热烈如大火,”塞缪尔·佩皮斯在他17世纪咖啡馆之旅中写道——那时的咖啡馆是伦敦八卦精英的社交神经中心。


快进到21世纪,喧闹的聊天群体已被键盘敲击的声响取代——远程工作者忙于在笔记本电脑键盘上敲打,并且在视频通话中大喊,以便听到机械磨豆机的声音。随着后疫情时代居家办公的兴起与整天呆在家的实际弊端相冲突,咖啡馆成了远程工作者的避风港,只需花费一杯扁平白咖啡的价格便可以获得一张桌子和一个WiFi连接。

但一些咖啡馆老板正在发起反击,抵制这一笔记本电脑劳动力的入侵。“禁止使用笔记本电脑”的标志在英国各地的咖啡馆窗户上纷纷出现,店主们试图为了宁静而重新夺回自己的空间。为Ollie Gold这位Pophams Bakery的共同创始人而言,在2022年新开业的最新店铺中,限制笔记本电脑的使用初期是一项业务决定,旨在确保更高的翻台率,从而使企业能够生存下去。“我依稀记得那些早期的日子,我希望有人在笔记本电脑前坐上八个小时,但当生意变得越来越忙时,你就开始不得不做出更具商业意识的决定。”他说。

“有些人花三英镑买一杯茶,却整天坐在那里……你不能以那种方式让一个地方持续经营。”不久后,Gold觉得笔记本电脑的屏幕不仅侵占了Pophams的社区灵魂,也侵蚀了利润率。在最初的周末禁令后,他决定在日常工作日全面限制笔记本电脑的使用。伦敦田野的分店对笔记本电脑的使用进行了限制,仅允许在高桌和窗边使用。“有些日子我走进去,看到处都是笔记本电脑,我想:让我们回到创办这个商店的初衷,创造一个社区,让人们进来交谈,无论是与伴侣、家人还是朋友。我们不想让笔记本电脑充斥,因为那完全改变了一个地方的能量和氛围。”

Milk and Bean咖啡馆的老板Chris Chaplin也感到失望,当初梦想中的“像家一样”的咖啡馆却开始变得像一个共享空间。“我们有一些人会组团前来工作,然后围在一台笔记本电脑旁,把我们当作他们的办公室,这让我感到非常反感。”因此,他们决定每人每天限制使用笔记本电脑一小时,并在周末全面禁用,认为这是对这家小咖啡馆公平的妥协。这个政策通过咖啡馆里一块友好的宣传牌表示,“我们更愿意将桌子留给欢笑、调情和交谈”,大多数顾客对此表示欢迎。

位于伦敦Bow的Grounded咖啡馆从周一到周五的上午11点到下午3点也实施了笔记本电脑禁令,顾客的反应褒贬不一。“有些人会说:‘哦,是的,我很抱歉,我不知道,’”总经理Vestina Pranaityte说。但也有人表示不满。“我们有一个常客以前经常一早就来,大约半点钟,她只点一杯长黑咖啡,用笔记本电脑待到三点。她对我们的笔记本电脑政策很不满,结果她离开了我们,”Pranaityte补充道。

根据国家统计局的数据显示,去年秋天,有超过四分之一的成年人兼职在家工作。大学生Ed Fisher是Grounded的顾客,他表示允许在咖啡馆使用笔记本电脑可以给年轻人带来好处,因为他们的居住空间通常很小。“伦敦的住房条件可能相当拥挤。我和四个小伙子住在一个小公寓……并不是每个人都拥有一个大地方,所以如果人们想完成一些工作,咖啡馆是个不错的去处,”他说。

英国的连锁咖啡馆,包括Costa、Caffè Nero和星巴克,至今尚未跟随一众独立咖啡馆对笔记本电脑使用进行限制,不过星巴克在美国和加拿大最近结束了其允许顾客在未消费的情况下在店内使用设施的开放政策。来自Black Sheep Coffee的代表表示:“顾客在饮用时如何花费时间完全由他们决定。我们在Black Sheep欢迎每个人,无论有无笔记本电脑:学生和老年人、年轻专业人士和全职父母。无论你是单独来,还是与约会对象,或者和整个家庭一起,无论你是来读书还是开会,我们都会为你提供服务,让你感到受欢迎。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB