父母必须在智能手机上做出艰难选择,英格兰儿童专员指出

父母应该为孩子的智能手机使用做出艰难决定,而不是试图成为他们的朋友,英格兰的儿童专员戴姆·拉Rachel de Souza说。


de Souza表示,父母应考虑自己的智能手机使用对孩子的示范作用。在《星期日泰晤士报》中撰文,de Souza指出:“如果我们认真保护我们的孩子,就必须审视自己的行为。”她补充道:“作为父母,屈服于孩子的请求是一个真实的诱惑。每个父母都会面临这种情况。为了让他们不打扰你,给他们再看一会儿电视……买一部新智能手机,尽管内心深处有个声音在质疑这一点,但仍然选择不去考虑,因为‘我所有的朋友都有一部’,尽管你知道自己花了多少时间在智能手机上。”

“你不应该成为孩子的朋友。有时候,作为父母意味着要做出艰难的决定,以保障孩子的长远利益,无论他们多么强烈地反对。”她指出:“他们需要你给予爱、理解、支持和界限。这意味着倾听孩子,始终鼓励他们追逐自己的抱负,但不仅仅是去满足他们的所有愿望。”

根据儿童专员的一项调查,近四分之一的孩子每天在连接互联网的设备上花费超过四小时。本月早些时候的一项YouGov调查显示,502名英格兰8至15岁的儿童中,有23%每天在电脑、手机、平板或游戏机等互联网设备上花费超过四小时。有四分之一(25%)的儿童每天在这样的设备上花费两到三小时,而五分之一(20%)则花费三到四小时。

de Souza补充说,父母需要“对与孩子进行有关他们在线看到的内容的挑战性对话感到自信”。“我们需要父母给孩子提供机会,讨论他们在网上看到的暴力或性内容,而不是仅仅没收他们的设备,因为这会在其他地方找到他们。”她表示:“作为成年人,我们自己也沉迷于多巴胺,不断滚动着手机,而我们仍然不知道我们的孩子在看什么。”

教育部长布里奇特·菲利普森正在研究一些英格兰学校禁用智能手机的影响,这一政策想法得到全国教育工会的支持,原因是对社交媒体对孩子影响的担忧与日俱增。当前的非正式指导方针指出,学校应在上课期间以及课间和午餐时间禁止使用手机,但并未说明学校如何执行禁令。

de Souza对英格兰15000所公立学校的调查发现,99.8%的小学和90%的中学在上课期间限制手机使用,包括在校园内禁止使用手机、要求学生交手机或将其放在安全的地方,或要求手机保持在视线之外。作为前校长,de Souza曾表示,禁止手机的决定应由学校领导而非国家政府强制实施。

她在《星期日泰晤士报》中写道,她认为“学校只是解决方案的一部分”。“校长们告诉我,尽管他们有自己的政策,但他们仍然对孩子在网上的安全深感担忧,因为孩子在手机上度过的时间大部分是课外时间,在父母的照顾下。”上个月,保守党的领袖凯米·巴登诺克质疑政府为什么反对一项保守党修正案,该修正案要求学校禁止使用手机。首相基尔·斯塔默则表示,这一提议“完全没有必要”,他声称“几乎每所学校”都已经禁用手机。

探索更多相关主题
智能手机 | 儿童 | 学校 | 父母与养育新闻分享重用此内容。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

TikTok视频中的电子音乐观看次数超越独立音乐

视频标签#ElectronicMusic在去年全球吸引了超过130亿次观看,比2023年增长了45%。


这是音乐产业平行世界的又一例证。虽然加拉赫兄弟今年夏天将在世界体育场演出,但在TikTok上,用户们正在随着不同的节拍而动。根据这一社交媒体应用的数据,使用电子音乐作为音轨的帖子观看次数首次超过了标记为独立和另类音乐的帖子。去年视频标签为#ElectronicMusic的观看次数超过了130亿次,比2023年增长了45%,增长速度超过了“独立和另类”以及“说唱和嘻哈”这两个类型。在同一期间,电子音乐标签的视频创作数量增长了100%以上。

TikTok表示,创作者尤其选择电子音乐作为特定类型视频剪辑的背景音乐,如体育、健身和时尚。它在旅游内容和夏季假期回顾中也非常受欢迎。TikTok英国和爱尔兰音乐合作负责人Toyin Mustapha表示,英国艺术家如Disclosure和Joel Corry的成功突显了电子音乐的主流地位。“舞曲变得更加易于接触,且在商业领域越来越重要,”他说。“我们看到艺术家的边界在不断被打破,TikTok也是其中的一部分。”

TikTok拥有超过10亿的全球用户,已成为破格和支持音乐艺术家的重要平台。去年夏季的热门歌曲之一,Adam Port的《Move》,在该应用上建立了其吸引力,之后成为了流媒体热门单曲,在英国和整个欧洲进入前十名。去年在TikTok和流媒体平台上另一个热门作品是Pawsa的《Dirty Cash (Money Talks)》,该曲在英国排行榜上达到第17位。

Fred Again在雷丁和利兹音乐节的压轴演出突显了电子音乐艺术家在主要市场的崛起,但Mustapha也指出了他们在主流排行榜上的成功。Jazzy成为十年来首位登上爱尔兰榜单第1位的女性爱尔兰艺术家。“这不仅体现在音乐节的演出上,你也可以在官方排行榜上看到它,”他说。

近年来,两位英国DJ在TikTok上迅速崛起。Hannah Laing是一位来自邓迪的前牙科护士,被称为“打击乐女王”,在该平台上逐步建立了自己的音乐生涯,并推出了自己的音乐节和品牌。Billy Gillies是来自贝尔法斯特的DJ,其热门曲包括《DNA (Loving You)》,也在该平台上建立了广泛的追随者。

英国关于#ElectronicMusic标签的视频观看次数增长了22%,而使用相同标签创作的视频数量增长了超过50%。“TikTok用户倾向于标记音乐的类型,尤其是电子音乐这样的类型。它展示了他们试图建立和参与的社区,而电子音乐非常注重社区驱动,”Mustapha说。

Spotify表示,自2000年以来,舞曲和电子音乐的流媒体播放每年平均增长18%,而自2021年以来,鼓与贝斯的流媒体播放增长了94%。不过,独立和另类音乐以及说唱和嘻哈在TikTok用户中仍然是更大的音乐类型,尤其是由于英超乐队Oasis的复出,独立音乐可能会获得更多关注。去年,TikTok标记了一种趋势叫做“Britishcore”,它庆祝英国生活中的更平凡方面,同时也捕捉到了对加拉赫兄弟复出的兴奋感。在他们的复出巡演宣布后的两个星期,标签#OasisReunion收获了超过1亿次视频观看。

除了电子音乐的蓬勃发展,去年英国TikTok用户也接受了音乐行业的收藏。TikTok用户的老歌使用率创下新高,超过五年的曲目在2024年的50首热门曲目中占据19首。流行的旧曲目包括Sade的《Kiss of Life》和Sophie Ellis-Bextor的《Murder on the Dancefloor》。与电子音乐一样,这一趋势在全球范围内也有所体现,全球前50首歌曲中有20首来自往年曲目,其中以1980年代德国合成流行乐队阿尔法维尔的《Forever Young》为首。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

KnowBe4 被认定为2025年海湾合作委员会科技最佳工作场所

连续第二年,KnowBe4 被 Great Place To Work 评选为海湾合作委员会(GCC)科技最佳工作场所。图片{ width=60% }


KnowBe4 是全球知名的网络安全平台,全面应对人类风险管理。今日宣布,KnowBe4 连续第二年被评为2025年 GCC 国家科技最佳工作场所,跻身全球知名雇主之列,此项荣誉表彰了 KnowBe4 对卓越企业文化的坚定承诺。

排在第14位的 KnowBe4 在科技最佳工作场所名单上的认可,反映了其对激进透明度、极致责任感和持续职业成长文化的承诺。迪拜团队在塑造 GCC 安全意识行业方面走在前列,结合了初创企业的灵活性与全球组织的实力。这一认可重申了 KnowBe4 赋能员工和促进创新、参与和成功并存的工作场所的决心。

“在 KnowBe4,我们的员工是我们成功的原动力,” KnowBe4 的首席人力资源官 Ani Banerjee 说道。“获得这一奖项是对我们致力于营造一个员工感到被重视、得到支持并能成长的工作场所的证明。通过持续投资于职业发展、顶级培训项目和如学费报销及认证奖金等具有影响力的福利,我们致力于为团队提供他们茁壮成长所需的资源。”

作为工作场所文化的权威,Great Place to Work 其方法论基于一个全球公认的框架,该框架衡量员工在组织内的信任、骄傲和乐趣的体验。通过对 GCC 国家员工的调查,这份名单确定了在该地区培养积极和包容工作场所文化的顶级公司。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Cato Networks推出Cato CASB的生成式AI安全控制

Cato CASB增强了一个影子AI仪表板,提供对生成式AI应用的全面可视化,并配备强大的政策引擎用于治理生成式AI的使用。图片{ width=60% }


今天,Cato Networks,作为SASE的领导者,推出了Cato CASB(云访问安全代理)的生成式AI(GenAI)安全控制。Cato CASB作为Cato SASE云平台中的原生功能,现在增强了针对生成式AI应用的新能力,包括影子AI仪表板和政策引擎。借助影子AI仪表板,企业可以检测、分析并深入了解生成式AI的使用情况。通过政策引擎,企业可以控制用户在生成式AI应用中的活动。Cato结合这两方面,使安全和IT团队能够在创新与风险管理之间取得平衡。

生成式AI迅速成为员工提升生产力和自动化任务的首选工具。然而,随着生成式AI采用的激增,出现了日益严重的影子AI问题,即员工在没有IT监督的情况下使用生成式AI应用程序。根据Gartner®的预测,“到2027年,超过40%的与AI相关的数据泄露将是由于跨境生成式AI(GenAI)不当使用造成的。”¹

影子AI的不断增长趋势使企业面临安全、合规和运营风险。敏感的公司数据可能在不知情的情况下共享给生成式AI应用,可能违反监管要求,并且错误信息或偏见输出可能影响商业决策。

有了Cato CASB的新生成式AI安全控制,安全和IT团队可以:

  • 发现影子AI:区分授权使用和未授权使用,通过识别所有生成式AI应用并对其进行分类。Cato提供了950多个生成式AI应用的目录。
  • 控制生成式AI应用访问:通过在细粒度水平上定义和执行访问政策,确保生成式AI的负责任使用。控制可以访问哪些生成式AI应用,以及在其中可以执行哪些操作(上传、下载等)。
  • 保护敏感数据:实时限制或防止将敏感数据上传到大型语言模型(LLM),避免数据安全和保密违反。
  • 维护治理和合规性:通过全面可视化所有用户活动,以符合企业政策和监管标准的方式推动生成式AI的采用。

“企业需要智能的方式来治理生成式AI,”Cato Networks产品管理副总裁Ofir Agasi表示。“通过对Cato CASB的增强,我们在Cato SASE云平台内利用AI发现、分类和保护生成式AI应用的使用方式。我们为安全和IT团队提供了管理风险和负责任地实现创新的工具。”

“Cato Networks让我们在不担心曝光敏感数据或知识产权的情况下放心使用生成式AI,”CloudFactory安全运营负责人Shayne Green表示。“借助Cato CASB的新生成式AI安全控制,我们可以以受控风险的方式采用生成式AI工具。”

可用性
Cato CASB的生成式AI安全控制面向全球客户正式推出。

资源

了解有关Cato CASB中新生成式AI安全控制的更多信息,请访问博客。
了解Cato的AI安全方法和Cato的AI/ML能力。
Cato CASB的生成式AI安全控制是Cato最新的AI创新,于SASEfy 2025期间宣布,SASEfy是Cato的全球虚拟活动。今年的活动聚焦于SASE和AI。 如果您错过了SASEfy 2025,注册以点播观看录制内容。

Gartner免责声明
¹ Gartner新闻稿,“Gartner预测到2027年,40%的AI数据泄露将源于跨境生成式AI的不当使用,”2025年2月17日。
GARTNER是Gartner, Inc.及其子公司的注册商标和服务标志,在美国和国际上使用并获得许可。保留所有权利。
PR Newswire PR Newswire赋能传播者识别和参与关键影响者,制作和分发有意义的故事,并衡量他们努力的财务影响。Cision是全球领先的公关和市场传播专业人士的媒体软件和服务提供商。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Josys推出业内首个SaaS管理评分卡

增强的访问自动化加强SaaS治理和IT效率
Josys,这个简化IT工作的SaaS管理平台,今天推出了一款首个同类的分析仪表板,旨在揭示和解决有效SaaS管理中的安全和效率差距。图片{ width=60% }


此外,该公司还推出了一系列免提的自动访问管理工作流程,旨在执行零信任原则。整体而言,这些进步赋能组织获取所需的洞察和功能,以主动应对SaaS安全风险,降低不必要的成本,并优化运营效率。

SaaS管理评分卡为客户提供了改善SaaS健康的路线图
随着SaaS在大多数组织中的失控,绝大多数IT领导者都缺乏系统性的方法来评估他们所面临的挑战。Josys设计了新的SaaS管理评分卡,旨在提供SaaS管理绩效的整体评估以及一系列个性化建议,帮助IT降低与其SaaS足迹相关的风险。

在实践中,每个Josys客户将获得他们自己的SaaS管理分数,一个从1到100的综合分数,基于一种专有算法,该算法衡量组织在四个关键维度(应用、许可证、账户和访问)上的SaaS管理实践的有效性。评分卡揭示了改进的关键机会,并提供单击访问以修复影响其整体分数的问题。随着时间的推移,评分卡将呈现纵向跟踪,以便IT领导者验证他们在SaaS管理中的投资并向组织内的利益相关者展示进展。

Josys的首席执行官松本康兼表示:“我们听到的最大挑战是客户不知道如何开始应对SaaS扩张。我们开发SaaS管理评分卡,以帮助IT领导者清晰地绘制出改善其SaaS管理姿态的行动路线图。除了清理运营低效外,我们设想SaaS管理分数将作为一个关键的指引,确保我们的客户在其SaaS生态系统不断演变的过程中保持正轨。”

自动访问管理工作流程执行零信任政策
在加强SaaS治理的承诺基础上,Josys扩展了其访问管理能力,推出新的自动工作流程,使IT团队能够在组织中执行访问策略,而无需手动干预。这些新功能帮助保障访问、减少影子IT,并优化许可证使用。

显著的工作流程改进包括:

  • 自动许可证审核:IT可以设置策略以标记未使用的许可证并触发自动注销,或启动访问审核调查,以收集用户对许可证是否仍需的反馈。
  • 安全员工离职管理:IT团队可以自动注销所有终止员工的应用访问,降低与孤立账户相关的安全风险。
  • 简化访问审核:IT管理员现在可以直接向应用所有者请求反馈,而不是尝试从所有具有访问权限的用户中收集调查反馈,从而简化访问审核,同时确保适当的用户权限。

增强的用户体验和集成
Josys还推出了对其用户界面的显著增强,包括重新设计的导航菜单,提供更直观的管理体验。新的导航简化了对访问、应用、许可证和安全性等核心功能的访问。此外,Josys继续扩展其应用生态系统,超过350个直接的SaaS集成出现在其目录中。与Jamf的最新集成为Josys的360度资产管理能力增加了对苹果设备的更广覆盖。

通过这些强大的更新,Josys继续为组织提供流简化SaaS操作、加强安全和优化成本所需的工具,以应对日益复杂的IT环境。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Goodfire 获得5000万美元A轮融资以推进AI可解释性研究

Funding from Menlo Ventures powers Goodfire’s mission to decode the neurons of AI models, reshaping how they’re understood and designed
Today, Goodfire, the leading AI interpretability research company, announced a $50 million Series A funding round led by Menlo Ventures with participation from Lightspeed Venture Partners, Anthropic, B Capital, Work-Bench, Wing, South Park Commons, and other notable investors.图片{ width=60% }


This funding, which comes less than one year after its founding, will support the expansion of Goodfire’s research initiatives and the development of the company’s flagship interpretability platform, Ember, in partnership with customers.
“AI models are notoriously nondeterministic black boxes,” said Deedy Das, investor at Menlo Ventures. “Goodfire’s world-class team—drawn from OpenAI and Google DeepMind—is cracking open that box to help enterprises truly understand, guide, and control their AI systems.”
Despite remarkable advances in AI, even leading researchers have little idea of how neural networks truly function. This knowledge gap makes neural networks difficult to engineer, prone to unpredictable failures, and increasingly risky to deploy as these powerful systems become harder to guide and understand.
“Nobody understands the mechanisms by which AI models fail, so no one knows how to fix them,” said Eric Ho, co-founder and CEO of Goodfire. “Our vision is to build tools to make neural networks easy to understand, design, and fix from the inside out. This technology is critical for building the next frontier of safe and powerful foundation models.”
To solve this critical problem, Goodfire is investing significantly in mechanistic interpretability research – the relatively nascent science of reverse engineering neural networks and translating those insights into a universal, model-agnostic platform. Known as Ember, Goodfire’s platform decodes the neurons inside of an AI model to give direct, programmable access to its internal thoughts. By moving beyond black-box inputs and outputs, Ember unlocks entirely new ways to apply, train, and align AI models — allowing users to discover new knowledge hidden in their model, precisely shape its behaviors, and improve its performance.
“As AI capabilities advance, our ability to understand these systems must keep pace. Our investment in Goodfire reflects our belief that mechanistic interpretability is among the best bets to help us transform black-box neural networks into understandable, steerable systems—a critical foundation for the responsible development of powerful AI,” said Dario Amodei, CEO and Co-Founder of Anthropic.
Looking ahead, Goodfire is accelerating its interpretability research through targeted initiatives with frontier model developers. By closely partnering with industry innovators, Goodfire will rapidly enhance and solidify the application of interpretability research. “Partnering with Goodfire has been instrumental in unlocking deeper insights from Evo 2, our DNA foundation model,” said Patrick Hsu, co-founder of Arc Institute – one of Goodfire’s earliest collaborators. “Their interpretability tools have enabled us to extract novel biological concepts that are accelerating our scientific discovery process.”
The company also plans to release additional research previews, highlighting state-of-the-art interpretability techniques across diverse fields such as image processing, advanced reasoning language models, and scientific modeling. These efforts promise to reveal new scientific insights and fundamentally reshape our understanding of how we can interact with and leverage AI models.
The Goodfire team unites top AI interpretability researchers and experienced startup operators from organizations like OpenAI and Google DeepMind. Goodfire’s researchers helped found the field of mechanistic interpretability, authoring three of the most-cited papers and pioneering advancements like Sparse Autoencoders (SAEs) for feature discovery, auto-interpretability frameworks, and revealing the hidden knowledge in AI models.
PR NewswirePR Newswire empowers communicators to identify and engage with key influencers, craft and distribute meaningful stories, and measure the financial impact of their efforts. Cision is a leading global provider of earned media software and services to public relations and marketing communications professionals.

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Goodfire完成5000万美元A轮融资,推进人工智能可解释性研究

Funding from Menlo Ventures powers Goodfire’s mission to decode the neurons of AI models, reshaping how they’re understood and designed

今天,作为人工智能可解释性研究领域的领先公司,Goodfire 宣布完成5000万美元的A轮融资,融资由 Menlo Ventures 主导,Lightspeed Venture Partners、Anthropic、B Capital、Work-Bench、Wing、South Park Commons 和其他知名投资者参与。图片{ width=60% }


这笔投资在Goodfire成立不到一年的时间内,为公司的研究倡议扩展和旗舰可解释性平台 Ember 的开发提供支持,与客户紧密合作。

“人工智能模型通常是不可预测的黑箱,”Menlo Ventures 的投资人 Deedy Das 表示。“Goodfire 的世界级团队来自 OpenAI 和 Google DeepMind,正在打开这扇门,帮助企业真正理解、引导和控制其 AI 系统。”

尽管人工智能取得了显著进展,甚至领先的研究人员也对神经网络的真实功能知之甚少。这一知识差距使得神经网络的工程化难度加大,系统故障变得不可预测,随着这些强大系统的复杂性提高,其部署风险也在加大。

“没有人了解 AI 模型失败的机制,因此没有人知道如何修复它们,”Goodfire 的联合创始人兼首席执行官 Eric Ho 说道。“我们的愿景是建立工具,使神经网络的理解、设计和修复变得简单明了。这项技术对于构建下一个安全且强大的基础模型的前沿至关重要。”

为了应对这一关键问题,Goodfire 在机械可解释性研究方面进行了大量投资——这一相对新兴的科学领域专注于反向工程神经网络并将这些见解转化为一个通用的、模型无关的平台。Goodfire 的平台 Ember 旨在解码 AI 模型内部的神经元,为用户提供对其内部思维的直接、可编程访问。通过超越黑箱输入和输出,Ember 解锁了全新的应用、训练和调整 AI 模型的方式——使用户能够发现模型中隐藏的新知识,精确塑造其行为并提高性能。

“随着 AI 能力的进步,我们理解这些系统的能力必须与之保持同步。我们对 Goodfire 的投资反映了我们对机械可解释性是帮助我们将黑箱神经网络转变为可理解的、可引导的系统的最佳选择之一的信心——这为强大 AI 的负责任发展奠定了重要基础,”Anthropic 的首席执行官兼联合创始人 Dario Amodei 表示。

展望未来,Goodfire 将通过与前沿模型开发者的针对性合作,加速其可解释性研究。通过与行业创新者密切合作,Goodfire 将迅速加强和巩固可解释性研究的应用。“与 Goodfire 的合作对于从我们的 DNA 基础模型 Evo 2 中解锁更深的见解至关重要,”Arc Institute 的联合创始人 Patrick Hsu 说道。 “他们的可解释性工具使我们能够提取出新的生物概念,从而加速我们的科学发现过程。”

公司还计划发布额外的研究预览,突显在图像处理、先进推理语言模型和科学建模等多个领域的最新可解释性技术。这些努力有望揭示新的科学见解,并从根本上重塑我们与 AI 模型的互动和利用方式。

Goodfire 的团队汇聚了来自 OpenAI 和 Google DeepMind 的顶尖 AI 可解释性研究人员和经验丰富的初创企业运营者。Goodfire 的研究人员帮助创立了机械可解释性领域,撰写了三篇被广泛引用的论文,并开创了特征发现的稀疏自编码器(SAE)、自动可解释性框架和揭示 AI 模型中隐藏知识等进展。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

CoreWeave推出NVIDIA GB200 Grace Blackwell系统规模化服务

初始客户包括IBM、Mistral AI和Cohere

CoreWeave,AI超级云服务商™,今日宣布Cohere、IBM和Mistral AI成为首批获得NVIDIA GB200 NVL72机架级系统和CoreWeave全栈云服务的客户——这一组合旨在推动AI模型的开发与部署。图片{ width=60% }


全球的AI创新者们现在可以访问专为推理和自我主张(agentic)AI设计的先进网络和NVIDIA Grace Blackwell超级芯片,这彰显了CoreWeave始终在先进AI云解决方案市场中的先行者角色。

“CoreWeave的构建目标是更快——我们一次又一次地证明了这一点,成为第一个在规模上实现最先进系统的企业,”CoreWeave联合创始人兼首席执行官Michael Intrator表示。“今天标志着我们的工程能力和响应速度的又一次证明,以及我们对推动下一代AI的始终不渝的关注。我们非常高兴看到有远见的公司在我们的平台上取得新的突破。通过提供最先进的计算资源,CoreWeave使企业和AI实验室客户能够更快地进行创新和部署曾经遥不可及的AI解决方案。”

“全球的企业和组织正在竞相将推理模型转变为将改变人们工作和生活方式的自我主张AI应用,”NVIDIA超大规模及高性能计算部副总裁Ian Buck表示。“CoreWeave快速部署NVIDIA GB200系统,为实现AI工厂的现实提供了AI基础设施和软件。”

CoreWeave提供先进的AI云解决方案,同时优化效率并突破性能记录。该公司在最近的MLPerf v5.0结果中,以NVIDIA GB200 Grace Blackwell超级芯片实现了AI推理的新行业记录。MLPerf推理是用于衡量机器学习在现实部署场景中性能的行业标准套件。

去年,该公司率先提供了NVIDIA H100和NVIDIA H200 GPU,也是首批展示NVIDIA GB200 NVL72系统的企业之一。

CoreWeave的云服务组合经过优化,适用于NVIDIA GB200 NVL72,提供性能和可靠性,包括CoreWeave Kubernetes服务、基于Kubernetes的Slurm(SUNK)、CoreWeave任务控制等。CoreWeave的NVIDIA Blackwell加速实例可扩展至高达110,000个Blackwell GPU,并配备NVIDIA Quantum-2 InfiniBand网络。

除了IBM、Mistral AI和Cohere外,CoreWeave近期还与ChatGPT的创建者OpenAI签署了为期多年的合同。


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

MYndspan任命Holmusk创始人兼首席执行官Nawal Roy为战略顾问

随着其Crowdcube募资活动的推进和EMOTIV的投资,MYndspan正加深对基于证据的脑健康的承诺。图片{ width=60% }


MYndspan是首家向消费者提供临床级MEG脑扫描的公司,今天宣布任命Holmusk的创始人兼首席执行官Nawal Roy为战略顾问。Roy在行为健康数据科学和真实世界证据方面的专业知识将帮助加速MYndspan的使命,使可衡量的脑健康对所有人可及。

这一任命是在MYndspan的股权众筹活动在Crowdcube上启动和全球神经技术领导者EMOTIV的战略投资之后,强调了MYndspan建立一个面向消费者的个性化、基于证据的脑健康生态系统的承诺。

准备好掌控您的脑健康吗?成为首批体验MYndspan旗舰伦敦脑健康中心世界最先进脑扫描的人之一,该中心将于今年晚些时候开业。MYndspan的基于MEG的脑扫描已经在《卫报》,《风格杂志》和ITV新闻中引起了广泛关注。

在Crowdcube投资MYndspan。

使用行为数据的黄金标准推动精准脑健康
Roy是Holmusk的真实世界数据平台NeuroBlu的架构师,Holmusk拥有全球最大行为健康数据库,涵盖来自30多个健康系统的超过3500万患者的纵向数据。他的工作在将心理健康护理从主观评估转变为数据驱动的科学方面发挥了重要作用。

“MYndspan正在构建脑健康所急需的:一种基于科学、用户可访问的方式来测量和监控我们的大脑功能,”Roy说道。“他们应用MEG的做法与Holmusk利用真实世界数据和客观指标改善心理健康结果的目标一致。”

在数据基础上构建未来的脑健康
MYndspan利用脑磁图(MEG),这是一种最精确、实时、无创的脑功能测量技术,创建了诸如功能性脑龄和脑稳定指数等新型生物标志物。Roy的任命将支持公司以下方面的努力:

  • 使用真实世界证据验证和扩展生物标志物模型
  • 实现预防和早期干预的纵向跟踪
  • 解锁新的临床研究和数据授权机会

“我们正在聚集神经科学、技术和行为健康领域的领军人物,以建立一个更智能的脑护理模型,”MYndspan联合创始人兼首席执行官Caitlin Baltzer表示。“Nawal的战略见解将在向数百万人推广我们的基于证据的方法中发挥重要作用。”

在超过1000亿美元的市场机会中处于领先地位
Roy的任命正值MYndspan准备开放其旗舰伦敦脑健康中心,并与包括MEGIN、BIOS Health、IMEDCO和EMOTIV在内的全球领导者扩展商业合作伙伴关系。通过这些合作伙伴关系,MYndspan正在建立精准脑健康的枢纽。

随着神经系统疾病成为全球导致残疾的主要原因,研究显示多达45%的痴呆病例可以通过早期检测预防,开发主动的脑健康解决方案的需求从未如此紧迫。

加入我们,共同建立脑健康的数据层。在Crowdcube投资MYndspan,塑造预防性脑护理的未来,借助世界最先进的脑扫描和个性化洞察力。

PR Newswire PR Newswire使沟通者能够识别和参与关键影响者,撰写和分发有意义的故事,并衡量其努力的经济影响。Cision是向公共关系和市场营销传播专业人士提供赚取媒体软件和服务的领先全球供应商。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

大语言模型的推理能力,不再是 AR(自回归)的专属。扩散模型现在也能「动脑子」,新框架 d1 让它们学会了解数学、懂逻辑、会思考。


当前,强化学习(RL)方法在最近模型的推理任务上取得了显著的改进,比如 DeepSeek-R1、Kimi K1.5,显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能。

不过,基于 RL 的后训练进展主要受限于自回归的大语言模型(LLM),它们通过从左到右的序列推理来运行。

与此同时,离散扩散大语言模型(dLLM)成为有潜力的语言建模的非自回归替代。不像以因果方式逐 token 生成文本的自回归模型那样,dLLM 通过迭代去噪过程生成文本,在多步骤操作中优化序列的同时并通过双向注意力利用过去和未来的上下文。其中,LLaDA 等开放的掩码 dLLM 实现了媲美同尺寸自回归模型的性能,而 Mercury 等闭源 dLLM 进一步展现了出色的推理延迟。

然而,顶级的开源 dLLM 并没有使用 RL 后训练,使得这一有潜力的研究方向还有很大的挖掘空间。这一范式转变引出了重要的问题:RL 后训练如何在非自回归上下文中高效地实现?

RL 算法适应掩码 dLLM 面临一些独特的挑战,原因在于自回归模型采用的已有方法(如 PPO、GRPO)通过计算生成序列的对数概率来估计和优化策略分布,导致无法直接应用于 dLLM。虽然这种计算在自回归模型中通过序列因式分解很容易实现,但 dLLM 由于它们的迭代、非序列生成过程而缺乏这种自然分解。

为了解决这些问题,来自 UCLA 和 Meta AI 的研究者提出了一个两阶段后训练框架 d1,从而可以在掩码 dLLM 中进行推理。在第一阶段,模型在高质量推理轨迹中进行监督微调;在第二即 RL 阶段,研究者引入了用于掩码 dLLM 的新颖策略梯度方法 diffu-GRPO,它利用提出的高效一步(one-step)对数概率估计在 GRPO 的基础上创建。

研究者表示,他们的估计器利用了随机提示词掩码,作为策略优化的一种正则化,使得可以扩展 per batch 的梯度更新数量并减少 RL 训练所需的在线生成数量。这将极大地降低计算时间。

图片

在实验部分,研究者使用 LLaDA-8B-Instruct 作为基础模型实例化 d1。他们将 d1-LLaDA 的性能与基础 LLaDA 模型以及仅使用 SFT 和仅使用 diffu-GRPO 训练的 LLaDA 模型进行比较。结果表明,d1 在四个数学和逻辑推理基准测试中始终优于基础模型,如下图 1 所示。d1-LLaDA 同样优于仅使用 SFT 方法和仅使用 diffu-GRPO 方法的模型。

图片

方法概览

d1 是一个两阶段框架,通过依次结合监督微调(SFT)和在线强化学习(RL)来增强预训练掩码 dLLMs 的推理性能。

其中,在线强化学习(特别是 GRPO 算法)已被证明能有效提升离线训练语言模型的性能。然而,GRPO 的学习策略并不能直接泛化到 dLLMs。

GRPO 的目标函数(如公式 3 所示)需要同时计算当前策略 π_θ 和旧策略 π_θold 在以下两个层面的(对数)似然比:

  1. token 层面(用于优势权重计算);
  2. 序列层面(用于反向 KL 散度项)。

核心问题在于:研究者需要高效计算 dLLMs 生成内容的逐 token 对数概率和序列对数概率。

自回归(AR)模型,如 Transformer,直接对每个 token 的对数概率进行建模,并且可以通过链式法则使用一次前向传递轻松计算出序列级别的对数概率。同时,KL 项可以分解为。

与 AR 模型不同,dLLMs 不遵循序列对数概率的顺序分解。同时,每个 token 的对数概率计算成本也很高,因为解码过程中需要多次调用掩码预测器 f_θ。基于此,该研究提出了一个高效的对数概率估计器。

对于序列对数概率,该研究使用均场近似方法,将其分解为独立的每个 token 对数概率的乘积。

对于每个 token 的对数概率,该研究引入了一种估计方法,该方法仅调用一次 f_θ。

基于新引入的对数概率估计器,该研究将 GRPO 扩展到掩码 dLLMs,推导出 diffu-GRPO 的损失函数。

图片

算法如下图所示。

图片

实验结果

表 1 报告了基线模型 LLaDA-8B-Instruct 与采用不同后训练优化方案的模型,在四项任务上的零样本性能对比。

图片

图 3 绘制了有效 token 的平均数量:

图片

基于实验,该研究得出以下主要发现:

diffu-GRPO 在所有 12 种设置中都一致优于基础的 LLaDA 和 SFT(监督式微调)。diffu-GRPO 和 SFT 都相较于 LLaDA-8B-Instruct 基线有所提升,但 diffu-GRPO 显示出更持续且幅度更大的增益。具体来说,diffu-GRPO 在所有 12 种设置中都优于 LLaDA-8B-Instruct 和 SFT,而 SFT 仅在其中的 7 种设置中优于 LLaDA-8B-Instruct,这表明** diffu-GRPO 相比于单独的 SFT 实现了更强的整体性能提升。**

LLaDA+diffu-GRPO 在所有设置中都优于基础的 LLaDA-8B-Instruct 模型,而 d1-LLaDA 在每种情况下都超过了 LLaDA+SFT。这表明,无论初始化是来自预训练模型还是经过 SFT 调整的检查点,diffu-GRPO 都能提供可靠的性能提升

d1 训练方案实现了最显著的性能提升。通过先进行监督微调(SFT)、再结合 diffu-GRPO 训练所形成的 d1-LLaDA 模型,产生了超越单一方法的叠加增益。这种组合式方法在 12 个实验设置中有 11 项优于纯 diffu-GRPO 方案,表明两个训练阶段存在协同效应。

定性结果表明,在 SFT 和 d1-LLaDA 生成中出现了顿悟时刻。尽管与 LLaDA-8B-Instruct 相比,生成序列长度为 128 和 256 的性能随着 SFT、diffu-GRPO 和 d1 有所提高,但从质的方面看,在生成的推理轨迹中并未观察到显著差异。然而当序列长度达到 512 时,该研究开始观察到 SFT 和 d1-LLaDA 模型展现出两种关键能力:自我修正机制和回溯行为。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB