Qmulos推出Q-行为分析与审计解决方案(Q-BA2)

基于情报界的内部威胁检测金标准,Q-BA2提供实时、数据驱动的洞察,以主动识别、调查和缓解安全威胁。图片{ width=60% }


Qmulos作为下一代合规、安全和风险管理自动化提供商,今天宣布推出一款先进的用户行为分析(UBA)和审计解决方案——Q-行为分析与审计(Q-BA2),旨在满足政府机构和商业企业的关键任务需求。Q-BA2基于情报界的内部威胁检测金标准ICS 500-27,提供实时的数据驱动洞察,以主动识别、调查和缓解组织网络中的安全威胁。

Q-BA2是一个一站式解决方案,提供先进的内部威胁检测和预防、强大的安全审计和严格的合规能力。通过利用AI/ML驱动的异常检测和Splunk强大的数据和分析平台,Q-BA2提供用户和实体行为的全方位可视性,具备持续监控、异常检测和动态实时警报功能。Q-BA2可以开箱即用地满足ICS 500-27、NIST、FedRAMP、CMMC、SOC 2和其他框架的合规要求。

“最大的网络安全威胁并不总是来自外部——它们往往起源于内部。先进的用户行为分析和内部威胁检测使组织能够检测异常、降低风险并保护敏感数据,防止损害的发生,”Qmulos首席执行官Matt Coose表示。

Q-BA2的关键能力与好处包括:

企业级用户行为分析

  • 早期威胁检测——通过AI/ML驱动的分析实时检测异常用户行为。
  • 基于风险的警报——根据风险行为触发警报,快速识别内部威胁和潜在安全漏洞。
  • 全面可视性——通过全面可操作的仪表板为安全团队提供丰富的洞察。

审计与合规准备

  • 规范的审计政策作为完整且优质数据的基础。
  • 开箱即用满足ICS 500-27、NIST和FedRAMP审计标准
  • 通过自动审计日志减少手动工作与合规成本
  • 满足审计人员对可防御的实时安全事件跟踪的要求

高级威胁狩猎与事件响应

  • 持续监控——监控所有用户和主机活动,以检测权限滥用、未授权访问和数据外泄。
  • 对风险用户和主机评分——根据行为模式和安全上下文优先处理威胁。
  • 快速调查与响应——安全团队可以快速处理警报并在损害发生之前响应威胁。

“没有一个全面的内部威胁解决方案,企业实际上是对可能已存在于其内部的危险视而不见。这类保障措施是至关重要的,”Coose补充道。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Blend推出《关键7:AI扩展策略》电子书

Blend,数据科学和人工智能解决方案的领导者,今天宣布发布其电子书《关键7:AI扩展策略》。图片{ width=60% }


这本综合指南解决了组织在将人工智能(AI)集成到其运营中时面临的七个关键挑战,并提供了切实可行的策略来克服这些挑战。

该电子书提供了克服企业AI采纳的七个最常见障碍的见解:

战略不匹配:构建AI计划以实现切实的商业价值,避免“试点地狱”
数据碎片化:通过AI支持的统一和治理识别并解决碎片化数据问题
缺乏信任:通过透明度和负责任的使用来建立对AI输出、平台完整性和工作安全性的信心
变化的步伐:制定平衡快速创新与负责任部署的政策
技术挑战:适应概率模型行为、基础设施需求和准确性权衡
AI人才短缺:通过再培训和针对性角色培训来应对AI专业知识的短缺
变更抵抗:通过重新定义流程、促进AI倡导者和全面管理转型来增强组织准备度

Blend开发的“关键7”框架旨在弥合AI潜力与其实用应用之间的差距。通过关注这七个关键领域,组织可以超越孤立的AI实验,实现企业级影响。

Blend360解决方案与服务线总裁Oz Dogan强调了该框架的影响:“在AI有潜力革命化行业的时代,许多企业发现自己陷入了‘试点地狱’,无法从实验转向全面实施。‘关键7’框架识别并提供AI成功最常见障碍的解决方案,包括战略不匹配、数据碎片化、人才短缺和信任问题。”

他继续说道:“使用‘关键7’框架的公司,其AI计划的启动成功率是四倍。一旦它们启动成功,成功将相互促进,加速基于AI的转型。”

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

RLWRLD融资1500万美元打造“机器人版GPT”

随着硅谷为互联网搭建人工智能,RLWRLD则在训练能够在现实世界中行动的AI,获得了来自LG、SK、KDDI、ANA等多个工业领军者的支持。图片{ width=60% }


RLWRLD是一家物理AI初创公司,正在构建机器人基础模型,今天宣布完成了一轮1500万美元的种子融资,得到来自韩国和日本工业领袖的强大联盟的支持。
此轮融资的投资方包括LG电子、SK电信、KDDI、ANA控股、三井化学和岛津株式会社,以及来自日本和韩国的领先AI专注风险投资,如Hashed、未来资产和Global Brain——这标志着对现实世界AI未来的重要跨国投资。
RLWRLD由金河围领导,他之前的公司Olaworks被英特尔收购,成为其首次收购韩国初创公司的案例。创始团队包括KAIST的杰出教授申仁浩、Kurly的前CTO、一名Kakao的工程负责人与一名前BCG合伙人,组成了一个世界级的团队,挑战AI中的下一个万亿美元机遇:能够在物理世界中移动、思考和适应的机器。
“硅谷正在为互联网构建大脑。我们则在为机器构建大脑。”
— RLWRLD创始人兼首席执行官金河围
从文本到触觉:物理AI的崛起
尽管生成式AI领导者们竞相掌握文本、代码和图像,RLWRLD正在开发从现实世界传感器、机器人系统和工业工作流程中学习的基础模型。这些模型使机器人能够在动态的物理环境中——如工厂、仓库、物流中心等——进行自主推理和行动。
RLWRLD的平台基于三个战略支柱:

  • 针对现实世界智能优化的具身模型架构
  • 来自东亚制造生态系统的工业规模数据管道
  • 与现有机器人系统无缝集成的即插即用基础设施

“我们不仅仅是在写论文——我们正在训练可以解决真实生产现场问题的模型。”
— 申仁浩,RLWRLD首席科学家及KAIST杰出教授
构建真实世界AI生态系统
这1500万美元的资金将加速RLWRLD的下一个阶段:

  • 在工业合作伙伴现场扩展专有数据管道
  • 提升其机器人基础模型堆栈
  • 深化与亚洲和北美的机器人和传感器公司的集成

该公司还通过与KAIST、首尔国立大学和POSTECH的合作以及与WIRobotics、Rainbow Robotics、Wonik Robotics、Robotis等机器人制造商的合作,构建一种多利益相关者的创新生态系统。
“RLWRLD将深度AI研究与规模化的工业执行结合在一起。这使得这是一个稀有且高信心的投资。”
— Simon Seojoon Kim,Hashed首席执行官
PR NewswirePR Newswire使沟通者能够识别和接触关键影响者,构建和分发有意义的故事,并衡量其努力的财政影响。Cision是全球领先的提供公关和市场传播专业人士所需的媒体软件和服务的提供商。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

与SINBON一同应对机器人部署挑战

随着对机器人解决方案神经系统设计和制造的专业知识的提升,SINBON专注于通过定制化来解决实施挑战。图片{ width=60% }


尽管机器人技术具有提升生产力的潜力,但仍有多个实施挑战阻碍了更广泛的采用。为了帮助公司应对这些挑战,SINBON电子股份有限公司(TWSE#:3023),一家领先的电子组件制造商和整体解决方案提供商,强调了根据行业、企业、设施和流程的独特特征来定制解决方案的重要性。

根据领先的机器人评估平台QVIRO的调查,项目工程师在实施自动化时面临以下几个关键挑战:

  • 与现有系统的集成:将机器人解决方案与传统基础设施无缝整合需要灵活性,并且常常需要外部专业知识。
  • 技能劳动力短缺:除了安装之外,还需要专业技能来维护自动化设备。
  • 成本与收益分析:评估初始投资的长期影响至关重要,而不仅仅关注短期效果。
  • 安全与合规:机器人使用的监管标准需要严密关注以确保遵循和工作场所安全。
  • 技术挑战和维护:运营连续性必须与技术的维护相平衡。

面对这些挑战,释放自动化的长期效益需要仔细了解每个公司的独特挑战及其设施的特征。凭借在机器人、制造设计和系统集成方面的深入专业知识,SINBON采取了这种量身定制的方法,指导企业部署机器人技术。

在机器人领域的十年创新
SINBON专注于机器人解决方案神经系统的设计和制造,特别是电缆束、控制系统和印刷电路板。SINBON在为机器人设备制造性能高、轻量化和坚固耐用的电缆束方面表现尤其出色,确保在各种应用中稳定可靠。

自2014年进入机器人领域以来,SINBON扩大了其能力,涵盖多个服务各种行业的机器人和自动化技术,包括:

  • 工业机器人:主要用于汽车、电子和金属加工应用
  • SCARA机器人(选择性合规装配机器人臂):用于电子装配、包装和半导体制造
  • 人形机器人:用于客户服务、教育和医疗保健
  • 特殊用途机器人:设计用于极端环境,如军事应用、灾难救援、核处理和深海探索
  • 笛卡尔机器人:用于高精度半导体包装、精密仪器装配和实验室自动化
  • 服务机器人:如送餐机器人、伴侣机器人和医疗护理机器人
  • 协作机器人(Cobots):旨在与人类并肩工作,提升工作流程
  • 并联机器人(Delta机器人):广泛用于食品包装、制药和自动化检测应用
  • 仓库机器人:用于智能物流和仓库管理,包括AGV(自动导引车辆)和AMR(自主移动机器人)

SINBON的竞争优势
作为一家以可持续性为首要目标的制造商和在欧洲、美洲和亚洲的可信赖合作伙伴,SINBON通过量身定制的机器人解决方案引导客户完成他们的自动化之旅,以推动效率和创新。凭借咨询式的方式和长期的客户支持,该公司确保自动化使企业能够持续增长。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Obsidian Security任命新首席产品官

Obsidian Security宣布任命Khanh Tran为其新任首席产品官(CPO)。图片{ width=60% }


作为前JumpCloud的首席产品官和CrowdStrike的产品管理副总裁,Tran在安全产品管理和建立成功公司方面积累了超过20年的经验。除了这些企业成就,Tran还担任过多家初创公司的投资者和顾问,拥有驱动增长的良好记录。与Khanh一起加入Obsidian的还有两位来自CrowdStrike的前产品负责人Rekha Das和Alex Graul。Das将领导Obsidian在面对代理AI的新SaaS挑战时的平台、合作伙伴和代理AI的投资。Graul将负责用户体验设计和用户界面工程,专注于为参与共享责任模型的所有用户简化SaaS安全问题。

随着企业越来越依赖SaaS,它们面临着寻找和保护联合、未联合和未授权应用程序的日益严峻的挑战。共享责任模型将数据保护的责任转移给客户,而复杂的SaaS到SaaS集成需求现代的安全解决方案。随着代理AI的出现,这一问题变得更加紧迫——这一身份的新分类将要求严格的身份验证和权限。如今,应用程序所有者为获取SaaS的价值而优化,但往往缺乏管理对敏感数据的访问所需的工具和专业知识。尽管对零信任的投资不断增加,当前的方法在解决特定于SaaS的风险方面仍显不足。威胁行为者和监管者都开始关注配置、监控、影子IT和帐户治理中的关键漏洞。

Obsidian首席执行官Hasan Imam表示:“我们有机会建立一个标志性的、持久的公司。SaaS的商业灵活性带来了新的安全边界。”他说:“在我和Khanh的最早对话中,很明显,他创新的视野和保护客户的决心将实现我们的使命,为任何人类、非人类和代理身份打造数字韧性。”

Obsidian Security的专有知识图谱建立在对SaaS身份及其整合的深入理解之上,以规范非结构化日志。Obsidian的身份威胁检测与响应(ITDR)解决方案专门用于监控异常的SaaS活动,通过在数百次事件响应中的直接经验进一步丰富。Obsidian Security的基础是全球最大企业的网络,提供有效的近实时检测,防止复杂的SaaS攻击,包括内部风险。同时,Obsidian的以上下文为驱动的SaaS安全态势管理(SSPM)解决方案保护已知和未知的应用程序,满足不断变化的合规要求。Obsidian Security是唯一一个专门建立来解决整个SaaS安全领域问题的综合平台:预防、发现、态势、集成风险、检测和响应。

Tran表示:“我对网络安全领域并不陌生。它从来不是静态的,也不可预测。”他说:“凭借其以身份为中心的视角和比任何其他解决方案更为丰富的现实世界漏洞洞察,Obsidian Security已经在SaaS安全领域领先。我致力于保护我们的客户,并不断改进我们的解决方案,以应对未来的威胁。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

「开源版GPT-4o」来了!这个17B国产模型生图效果比肩4o,还可商用

前段时间,GPT-4o 火出了圈,其断崖式提升的生图、改图能力让每个人都想尝试一下。虽然 OpenAI 后来宣布免费用户也可以用,但出图慢、次数受限仍然困扰着没有订阅 ChatGPT 的普通人。


那除了 GPT-4o,我们还有没有其他选择呢?去 Artificial Analysis 的文生图大模型竞技场找一下就知道了。

在这个竞技场上,我们发现前段时间排到第二名的模型 —— 拥有 17B 参数的 HiDream-I1 和 GPT-4o 得分很接近。

图片

AI 基准测试和分析平台 Artificial Analysis 发推宣布 HiDream-I1 成为文生图开源模型新 SOTA。这个平台采用竞技场模式来评估模型,即同时给两张不同模型生成的图像,让人类从中选出和 prompt 最贴合的。

值得一提的是,这个模型在上线的 24 小时之内就登顶了 Artificial Analysis 竞技场榜首,也是首个登顶该榜单的中国自研生成式 AI 模型。

通过一些对比图可以看到,HiDream-I1 的生成效果似乎不输 GPT-4o,比之前「把 Midjourney 打下神坛」的 FLUX1.1 [pro] 效果还要好。重点是,这三个模型里,只有 HiDream-I1 是开源的,而且是允许商用的那种开源(MIT 协议)。

图片
图片

而且,开源这个模型的国内公司 —— 智象未来刚刚宣布,他们即将开源的另一个模型 —— HiDream-E1 还支持交互式图像编辑,可以像 GPT-4o 那样把你提供的图修改为任意风格、任意内容。二者合在一起,实现了类似于 GPT-4o 图像生成和编辑的「言出法随」效果,填补了「开源版 GPT-4o」的空白。

图片

HiDream-E1 的图像编辑效果,模型将于近期开源。

那么,HiDream-I1 的效果究竟好在哪儿?我们可以多看一些案例详细分析。

HiDream-I1 生图效果如何?

GPT-4o、FLux 之所以能够走红,其生成画面的真实感、细腻度和遵循指令的能力起到了重要作用。

为了测试 HiDream-I1 能不能担得起「开源版 GPT-4o」这个称号,我们参考前段时间 OpenAI 官宣 GPT-4o 新能力时发布的一些 prompt 测试了一下。

图片

GPT-4o 博客中给到的生成案例与 prompt。

HiDream-I1 生成的结果如下:

图片

提示词:写实的照片,一匹马从右到左奔驰在一个巨大的,平静的海面上,准确地描绘了溅起的水花,反射,和马蹄下微妙的涟漪图案。夸张马的动作,但其他一切都应该是静止的,安静的,以显示与马的力量形成对比。干净的构图,电影般的。广阔的全景构图,展示远处的地平线。大气透视创造深度。放大后的马与浩瀚的海洋相比显得微不足道。

图片

提示词:真实水果与微型行星(木星、土星、火星、地球)混合而成的果盘照片,保持真实的反射、光照、阴影与原图一致,构图干净,纹理真实,细节渲染清晰

图片

提示词:一个真实的水下场景,海豚从一辆废弃的地铁车厢的窗户游进来,气泡和水流的细节被精确地模拟出来。

图片

提示词:这是一张狗仔队风格的偷拍照片,卡尔・马克思匆忙穿过美国购物中心的停车场,他带着惊讶的表情瞥了一眼,试图避免被拍到。他手里拿着几个锃亮的购物袋,里面装满了奢侈品。他的外套在风中飘动,其中一个包在摇摆,好像他正在大步前进。模糊的背景与汽车和发光的商场入口,以强调运动。相机发出的闪光部分过度曝光了图像,给人一种混乱的小报感。

整体上看,HiDream-I1 生成的图在真实感、细腻度上和 GPT-4o 是非常接近的,有时还能更胜一筹。在和 Flux 相比时,这个特点更加明显。

比如在下面这个例子中,HiDream-I1 生成的图像具有更多精细的元素,包括纹理、背景细节以及物体之间的层次感(猫毛在光的照耀下根根分明,给人一种强烈的生机感;咖啡壶的不锈钢材质恰到好处地反射光线,呈现出真实的质感)。相比之下,Flux 虽然也能生成具有良好细节的图像,但在细节材质上不如 HiDream-I1 细腻丰富。

图片

提示词:一只可爱的橙色猫咪坐在咖啡研磨机旁,用爪子慢吞吞地转动着研磨机的把手。猫咪专注的表情和温柔的咕噜声在舒适宁静的厨房里被捕捉到。柔和、温暖的光线透过窗户,在猫和磨床上投射出柔和的光芒,增强了宁静的氛围。这一场景以写实的风格呈现,强调平静和亲密。

在色彩的呈现上,HiDream-I1 的表现也更出色,能够生成层次分明、色调多样的图像(仔细看下图中狼的脸部毛发,HiDream-I1、GPT-4o 的颜色层次都更丰富)。Flux 的色彩使用虽然也相当丰富,但在某些场景下,色彩的搭配和过渡显得较为单一,缺乏一定的饱和度和层次感。

图片

提示词:一只穿着音乐家燕尾服的 3D 狼。像人一样两条腿直立站着,拿着吉他,周围是放大器和舞台,这里散发着艺术和优雅的气息。

此外,这种真实感、细腻感还来自模型对客观规律的理解。从下图可以看出,HiDream-I1 对客观规律的理解较为精确。无论是物体的摆放、人物的动作姿势,还是环境中的光影效果,HiDream-I1 都能展现出符合现实世界的自然规律。而 Flux 则在这方面存在一定局限,特别是在处理动态场景和复杂物理互动时,模型的表现不够真实,常常出现不符合物理定律的情况。

图片

提示词:一只穿着音乐家燕尾服的 3D 猫,两条腿直立,拿着小提琴,周围是旋转的音符和大钢琴,散发着艺术和优雅的氛围,聚光灯照亮了现场,创造了一个戏剧性和精致的环境。

即使是遇到复杂的提示词,这些特点依然能够在 HiDream-I1 生成的图中得到保留。这是模型复杂文本理解、遵循能力的体现。

图片

HiDream-I1 生成的图像。提示词:中世纪城堡的石砌城墙,身披铠甲的战士面向镜头,跃动的火焰在他身后勾勒出粗犷的面部轮廓。火星随风溅落在生锈的锁子甲上,右手不自觉地握紧腰间剑柄,深褐色的斗篷在热浪中剧烈翻卷。燃烧的箭矢在远处塔楼持续坠落,橙红火光与靛蓝夜空形成强烈对比,照亮了城墙垛口剥落的青苔和战士眉骨处的陈旧伤疤。

在各项基准测试数据中,以上视觉效果得到了印证:

  • 首先是 HPSv2.1,这是一个基于人类偏好选择数据集训练的偏好预测模型,能够对同一提示下产生的不同图像进行评分比较。在这个基准上,HiDream-I1 在多种风格(如动漫、概念艺术、绘画和真实摄影)上达到最优。这说明,HiDream-I1 生成的各种风格图像都更符合人类审美。

  • 其次是 GenEval 和 DPG-Bench,前者通过检测对象和颜色分类来验证生成图像与文本提示之间的匹配程度,后者专注于检测生成图像中的多个对象、详细属性和复杂关系(当提示又长又复杂的时候适合用这个基准评测)。在这两个基准上,HiDream-I1 都达到了最优。这说明,HiDream-I1 的指令遵循能力很强。

图片

HiDream-I1 在 HPSv2.1 上的得分数据。

图片

HiDream-I1 在 GenEval 上的得分数据。

图片

HiDream-I1 在 DPG-Bench 上的得分数据。

为了提升生图效果 智象未来做了哪些技术改进?

强大的指令遵循能力和逼真、细腻的生成效果本质上都要归功于技术改进。

为了提高模型理解文本的能力,HiDream-I1 采用了新的被称为「Sparse Diffusion Transformer(Sparse DiT)」的架构设计。这个架构在 DiT 框架下融合了 Sparse Mixture-of-Expert (MoE)技术,让不同的专家模型处理不同类型的文本输入,各有专精。

同时,这个架构设计还带来了一个额外的好处 —— 在提高模型性能的同时控制运算开销,使得 HiDream-I1 用起来性价比很高。对于关注开源模型算力消耗的个人开发者、创业公司来说,这是一个很有用的优化。

图片

HiDream-I1 模型架构图。

图像质量的提升则要归功于研究者在扩散模型蒸馏中融入生成对抗学习,借助 GAN 捕捉细节、锐化边缘的能力,在蒸馏扩散模型的同时进一步提升了生成图像的真实感和清晰度,实现速度与质量的双重优化。

值得一提的是,这样训练出来的 HiDream-I1 具有很强的可扩展性。所以在模型训练出来后不久,智象未来就将其扩展到了交互式图像编辑大模型 HiDream-E1,让图像编辑场景也有了「开源版 GPT-4o」可用。

HiDream 系列模型开源 影响力已初步彰显

无论从实测效果还是基准测试结果来看,智象未来的 HiDream-I1 都已经非常接近 GPT-4o,站稳了国内图像生成第一梯队。

图片

而且,由于模型是开源的,其国际影响力也在逐步显现。在开源后两天,文生图大模型竞技场上的另一家模型公司 —— Recraft AI 就宣布,他们已经集成了 HiDream-I1,还手把手教网友怎么选用这个模型。

图片

图片

在 HuggingFace Trending 榜单上,HiDream-I1 飙升到了第二名。这说明 HiDream-I1 的下载量、点赞数都很可观,在社区中非常受欢迎。

当然,没有本地部署需求的朋友也可以在智象未来的官方平台 Vivago 上体验 HiDream-I1。该平台上有更完整的工作流,支持在生成图像的基础上进行视频制作等二次创作。图片

Vivago 上的图像转视频效果。

据悉,过段时间,智象未来还将发布多模态 Agent 产品。它的核心是让大家用对话聊天的形式来生成图片 / 视频,并使用自然语言对图片 / 视频内容进行相应的编辑,从而渐进式地生成有故事情节的内容。便利之处在于不需要用户自己去跨平台选择调用需要的功能以及调节复杂的参数。

对于这样的模型改进、产品开发理念,智象未来 CTO 姚霆曾做出过解释 —— 在应用端,真实感、指令遵循和叙事性的能力是用户愿意为之付费的基础,所以智象未来在改进模型的过程中始终关注这三大属性。如今,他们把这三点做到了新的高度,还开源了模型,可以说为想在这一领域开发应用的开发者或公司扫除了基础障碍。

智象的研发人员透露,下一个开源模型–HiDream-E1 即将开源,相关基准测试数据也将在近日发布。期待这个模型带来优秀的编辑体验。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

30年悬案告破,平均曲率流的奇点真相曝光,揭晓「冰块融化」的数学秘密

一块冰块漂浮在水中,随着时间推移,它会逐渐融化成一个微小的冰粒,最终完全消失。在这个过程中,冰块表面变得越来越光滑,所有不规则形状和锐利边缘都会逐渐消失。


图片

对于你我来说,这是一个很常见的现象,而数学家们同样致力于理解这一现象,不过是更深奥的角度 —— 他们希望能够精确描述冰块表面或一座被侵蚀的沙堡的形状如何随时间演变。

为了分析这种现象,此前的研究人员研究了抽象数学曲面和形状按照特定规则集的演化过程。这组规则定义了平均曲率流(Mean Curvature Flow)过程,它能同时平滑曲面(即使是高度不规则的曲面)并使其收缩。

然而,随着曲面演化,可能会形成奇点(singularities)—— 即数学描述失效的点。在这些位置,曲面可能会急剧突出,或变得极度薄弱以至于曲率「爆炸」至无穷大。对于任何闭合的紧致曲面(如封闭球面)在平均曲率流过程中必然会出现奇点。

当这些奇点过于复杂时,流动将无法继续进行。

数学家们希望确保即使在奇点形成后,仍能分析表面的持续演化。1995 年,现任职于苏黎世联邦理工学院(ETH)的数学家 Tom Ilmanen 提出了 Multiplicity-one 猜想 。该猜想指出,在平均曲率流过程中形成的任何奇点都必须相对简单。「不良」行为应仅限于个别点:例如,不应出现多个区域(无论来自同一表面还是不同表面)相互堆叠的情况。

如果 Multiplicity-one 猜想成立,将证实奇点并非平均曲率流的障碍。即使出现奇点,流动仍可继续,使数学家能够评估表面的演化。

近几十年来,数学家们在描述曲面通过平均曲率流移动时的行为特性方面取得了诸多进展。「但到目前为止取得的很多结果都依赖于 Multiplicity-one 猜想的正确性,」加州大学伯克利分校(UC Berkeley)的数学家 Richard Bamler 说到,「在某种程度上,主要的障碍一直都是 Multiplicity-one 猜想。」

现在,他和纽约大学(NYU)的 Bruce Kleiner 终于证明了这个猜想确实正确。

图片

左为 Richard Bamler,右为 Bruce Kleiner。

「这是一个重大突破,」斯坦福大学(Stanford)的 Brian White 表示。这项工作不仅使数学家们能够更好地理解平均曲率流,而且可能在整个几何学和拓扑学领域有重要应用。

全速流动

平均曲率流概念在 20 世纪 50 年代被引入,用于解释金属冷却过程中出现的各种现象。1978 年,宾夕法尼亚州萨斯奎汉纳大学(Susquehanna University)的名誉教授 Kenneth Brakke 从数学角度形式化了这一概念。他的模型最终提供了一个更为通用的数学描述,可应用于任何维度的抽象曲面和形状。

Multiplicity-one 猜想涉及三维空间中的闭合二维曲面,如球体或环面(甜甜圈形状)。在这类曲面上的任意一点,可以计算给定方向上的曲率 —— 这是衡量曲面在该方向弯曲程度的指标。理论上可以考虑无限多的方向,但数学家们通常只关注那些给出最大和最小曲率值的方向。这两个数值的平均值被称为平均曲率(Mean Curvature),它能提供关于曲面在该点的许多重要信息。

图片

平均曲率流利用曲面信息以最快速和高效的方式减小曲面面积。在这一过程中,曲面上的每个点都以等于其平均曲率的速度移动 —— 且方向垂直于其「切平面」(切平面是在该点最佳近似曲面的二维平面)。这种垂直方向有两个选择,一个指向内部,另一个指向外部。如果曲面在该点向外凸出,则流动方向向内;如果曲面向内弯曲,则流动方向向外。

以球体为例,平均曲率流会使球体以越来越快的速率向其中心收缩。这是因为随着球体收缩,每个点的平均曲率会增大 —— 较小的球体比较大的球体弯曲程度更大。最终,球体会收缩为一个点,即球体中心原来所在的位置。

假设曲面是一个部分凹陷的球体,类似于某些地方被撞凹的足球。在平均曲率流的作用下,凹陷部分会被推出,而曲面其余部分则向内移动,使其逐渐接近完美球体,最终收缩为一点。

图片

这一过程同样能将圆柱体简化为一条线,将环面(torus)简化为一个圆。然而,对于更复杂的形状,如中心处变窄的哑铃形状,会发生不同情况。在平均曲率流作用下,手柄最细部分会首先收缩为一点,形成奇点(singularity)。这种奇点类似于肥皂泡从塑料棒上分离或水滴从水龙头分离时的「收缩点」。在该点,哑铃表面失去光滑性,曲率变为无限大。

这时问题出现了:无法将无穷大代入平均曲率流方程中。方程失效,无法再预测曲面的未来演化。但若移除该奇点,我们将得到两个独立的泪滴状部分,从而可以继续研究平均曲率流对这些部分的影响。这些部分会逐渐变得更加光滑圆润,几乎成为完美球体,最终收缩为两个分离的点。

对于任何闭合的紧致曲面 —— 即直径有限且有明确内外之分的曲面 —— 平均曲率流必然导致奇点形成。(对于简单球体,这个奇点就是曲面最终收缩至的那一点。)Bamler 表示:「这个本应使曲面变得更简单的流,随着过程进行到极限,我们知道它总会变得奇异,所以如果我们想理解这个流的作用,就需要理解它的奇点形成过程。」

这正是 Multiplicity-one 猜想的用武之地。

分离是成功的关键

简单的奇点(如夹点)可以直接去除,使平均曲率流畅通无阻。但如果奇点比较复杂,比如表面中的两块薄片聚集在一起,在整个区域内重叠,而不是只影响一个点,那么就不可能做到这一点。Bamler 表示,在这种情况下,「我们不知道流动是如何表现的」。

Ilmanen 提出了他的猜想,以排除这些麻烦的情况。几十年后,Bamler 和 Kleiner 开始证明他是正确的。

为此,他们想象了一种不寻常的形状,Kleiner 称之为「邪恶的双胞球」。它由两个球体组成,一个在另一个里面,由一个小圆柱体或颈部连接,形成一个单一的表面。Kleiner 指出,如果颈部快速收缩,将两个球形区域拉到一起,那将是「噩梦般的情景」。为了排除这种情况,他和 Bamler 希望了解这两个区域将如何相互作用,以及它们之间的距离将如何随时间变化。

于是,两位数学家将形状分解成不同的构件 —— 放大后看起来像平行薄片的区域,以及被称为最小曲面(平均曲率为零,因此在平均曲率流中不会移动)的特殊区域。然后,他们定义了一个函数,用于测量曲面上任意给定点到邻近区域最近点的距离。

他们找到了分析这个「分离函数」如何随时间变化的方法,证明它永远不会归零。这意味着噩梦般的情景永远不会发生。

数学家们可以轻而易举地将这种方法应用到包含相同类型构件的封闭表面上。但是,「一般的 [封闭] 曲面在某些区域可能看起来非常复杂,」Bamler 说,复杂到「可能使我们无法控制流动」。

他和 Kleiner 随后证明,这些有问题的区域必须非常小。Bamler 表示,「它对整个流动的影响微乎其微。因此,我们基本上可以忽略它。」

无论曲面多么复杂或奇特,分离函数都不会随着时间的推移而归零。换句话说,相邻区域永远不会趋同,也不会出现复杂的奇点。Ilmanen 的猜想是正确的。

事实上,Bamler 和 Kleiner 证明,平均曲率流几乎总是导致两种类型之一的特别简单的奇点:收缩为一点的球体,或坍缩为一条直线的圆柱体。Bamler 说:「任何其他类型的奇点都只出现在极少数非常特殊的情况下。在这些情况下,奇点非常不稳定,即使是最轻微的扰动也会消除它们。」

随着 Multiplicity One 猜想的解决,斯坦福大学的 Otis Chodosh 说:「我们现在基本上对三维空间中表面的平均曲率流有了一个完整的认识。」

他还补充说,这些知识可能会在几何学和拓扑学中得到重要应用,特别是如果数学家能够证明生活在四维空间中的三维表面的猜想。Bamler 和 Kleiner 正开始研究下一种情况,不过他们表示需要找到一种与二维表面不同的方法。

Chodosh 补充说,这个证明已经可以让数学家利用平均曲率流重新证明一个关于球体对称性的重要问题,即「斯梅尔猜想」。Bamler 说,以前对该猜想的证明相当复杂,使用平均曲率流的证明可能更容易理解。

一个被称为里奇流(Ricci flow)的相关过程已经被用来证明一些重要猜想,包括著名的庞加莱猜想(另一个关于球体的声明)。数学家们希望,Bamler 和 Kleiner 在均值曲率流方面的工作将帮助它成为一种类似的强大方法。White 说:「Bamler 和 Kleiner 让我们对均值曲率流核心奇点的理解有了巨大的进步。这无疑为我们提供了将其作为一种工具…… 来做各种奇妙事情的可能性。」

原文链接:https://www.quantamagazine.org/a-new-proof-smooths-out-the-math-of-melting-20250331/



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

免费用!阿里通义大模型上新,超逼真音视频生成SOTA!

近日,阿里通义实验室推出了全新数字人视频生成大模型 OmniTalker,只需上传一段参考视频,不仅能学会视频中人物的表情和声音,还能模仿说话风格。相比传统的数字人生产流程,该方法能够有效降低制作成本,提高生成内容的真实感和互动体验,满足更广泛的应用需求。


目前该项目已在魔搭社区、HuggingFace 开放体验入口,并提供了十多个模板,所有人可以直接免费使用。

图片

我们先来看两段视频,就能感知到生成内容的真实感有多强:

视频1
视频截图
视频2
视频截图

是不是已经分辨不出小李子莱昂纳多和 LeCun 是AI复刻出来的了?感兴趣的读者也可以从项目页查看更多Demo。

接下来,就让我们看下阿里通义实验室 HumanAIGC 团队对此论文的解读。

背景

近年来,随着语言大模型的迅速发展,虚拟主播、虚拟助手等应用得到了广泛的推广与使用。然而,针对文本驱动的数字人生成研究仍然较少,现有方法主要采用级联流水线的方式,将文本转语音(Text-to-Speech, TTS)系统与音频驱动的数字人模型相结合。这种传统流水线一方面引入了系统复杂性和延迟开销,尤其是在实时互动场景下,各模块之间的延迟问题成为影响用户体验的重要因素;另一方面还从根本上存在音画输出不同步以及生成语音与视觉表情风格不一致的问题,无法完美复制真人的说话风格。

为了解决这些局限性,我们提出了 OmniTalker,能够在零样本实时场景中,根据文本和参考视频同时生成同步的语音和数字人视频,同时保留语音风格和面部风格。该框架采用双分支 DiT 架构:音频分支从文本合成梅尔频谱图,而视觉分支预测精细的头部姿态和面部动态。为了桥接模态间的信息,我们引入了一种新颖的视听融合模块,整合跨模态信息以确保音频和视觉输出在时间上的同步性和风格上的一致性。此外,我们的上下文参考学习模块能够从单个参考视频中有效捕捉语音和面部风格特征,而无需额外引入风格提取模块。此方法特别注重保持声音的一致性和说话风格的真实性,同时优化了处理速度,确保了实时响应性能,从而显著提升了数字人生成的质量和效率。相较于传统的数字人生产流程,此方法能够有效降低制作成本,提高生成内容的真实感和互动体验,满足更广泛的应用需求。

图片
图 1. 区别于传统级联框架,OmniTalker 是一个端到端的统一框架,可根据文本和一段简短的参考音视频实时生成同步的语音和数字人视频,同时保持声音的一致性和说话风格的真实性。

方法介绍

图片
图 2. OmniTalker 结构图

我们的目标是在紧凑的网络架构中实现音视频联合生成,确保音频和视频输出之间的对应关系,同时从参考视频中复制声音和面部风格。受启发于 LLM 的上下文学习能力,以及多模态 DiT 在文生图中的优势,我们提出了如图 2 所示的模型架构。该架构有三个核心部分:

  1. 三个嵌入模块来分别捕捉参考音视频的动态特征以及文本信息,
  2. 一个双流 DiT 模型用于音视频并行建模,以及
  3. 一个音视频特征融合模块来确保音视频特征的紧密同步。

模型输入方面,包含驱动文本和参考音视频三种模态特征:

  • 音频特征:我们从参考视频中提取音频流,并利用梅尔谱图作为音频特征的表示方法。通过一个基于 MLP 的嵌入模块,我们将梅尔谱图转换为音频嵌入 x^a;
  • 文本特征:使用 ASR 模型将参考音频转化为文字,形成参考文本。随后,输入文本以及参考文本被转换成拼音序列(针对中文)或字符 / 字母序列(针对拉丁语系),并进行拼接。为了匹配音频嵌入 x^a 的长度,我们以某种填充标记对文本序列进行填充。文本嵌入过程采用了 ConvNeXt-V2 架构,生成的文本嵌入 c_t 作为条件指导音频和视觉分支的处理。
  • 视觉特征:对于视频片段,我们提取包含面部表情的 51 维混合形状系数、6 维旋转与平移参数(RT),以及每帧的眼球运动系数在内的视觉编码。如同处理音频特征一样,这些视觉编码也通过一个 MLP 映射到视觉嵌入 x^v 上,以实现统一的特征表示。

在训练阶段,音频和视觉特征会随机掩码序列的一部分,利用上下文学习来达成风格复刻的需求;而在推理阶段,则依据参考音频的节奏及输入文本的长度对音视频特征进行零填充,确保处理的一致性。

关于模型结构,我们方法的核心在于建模视频、音频和文本模态之间的交互,旨在生成既连贯又同步的音视频内容。我们的框架由一系列专门设计用于处理音频和视频数据流的 DiT 块组成,促进音频和视频特征间的跨模态融合,从而产出一致且同步的结果。模型的关键组件包括:

  1. 音视频特征融合模块:采用双分支架构,一个分支专注于处理视觉运动信息,另一个则负责解析音频信息。利用 MM-DiT 注意力机制,网络能够动态评估并平衡音频与视觉特征的重要性,确保最终生成的视频在时间轴上以及语义层面与输入音频完美对齐。
  2. 单模态 DiT 块:在完成初步的跨模态融合后,模型使用多个单模态 DiT 块进一步细化生成过程。这些块操作于已融合的多模态特征之上,但针对每个单独模态(即音频或视觉)进行优化,以提高输出质量。
  3. 音视频解码器:经过上述步骤生成的音视频特征随后通过预训练的解码器转换回原始格式。对于音频部分,我们使用 Vocos 解码器将合成的梅尔频谱图还原为语音,这是一种高保真声码器,也可替换为其他相似声码器如 HiFi-GAN。至于视频解码,我们设计了一个 GAN 模型(复用 ChatAnyone),它根据从参考视频中随机选取的参考帧为基础,并按照 DiT 模型预测的头部姿态和混合形状系数生成新的视频帧。该模型能以 30FPS 的速度生成分辨率为 512×512 的帧,满足实时推理的需求。

实验结果

鉴于当前尚无方法能够同时生成音频和视频,我们对文本转语音(TTS)技术和音频驱动的数字人生成(Talking Head Generation, THG)技术分别进行了比较分析。在 TTS 方面,我们挑选了三种代表性方法:MaskGCT、F5TTS 和 CosyVoice,并针对错词率(WER)和声音相似度(SIM)进行了对比评估。对于 THG 的评估,我们构建了一个多模态比较框架,涵盖以下几类方法:(1) 两种基于 GAN 的技术(SadTalker 和 AniTalker);(2) 两种最先进的基于 diffusion 的方法(EchoMimic 和 Hallo);(3) StyleTalk,一种具备风格保留功能的音频驱动 THG 方法。为了确保公平性和结果的可比性,实验中所有 THG 模型均采用由我们提出的方法生成的音频信号作为输入。

图片
表 1. TTS 性能对比

表 1 展示了我们的方法在音频测试集 Seed 上的测试结果,与 TTS 基线模型相比,我们的生成结果显示出更低的错词率(WER),这表明生成的音频与文本之间具有更高的一致性。此外,我们的方法在声音相似度(SIM)指标中排名第二,进一步证实了其在零样本条件下保持声音特征的能力。值得注意的是,通过对比包含和不包含运动分支(Ours w/o motion)的模型表现,可以看出完整模型实现了更低的 WER,这证明了结合视觉监督能有效提升生成音频的感知质量。我们将这种改进归因于多任务学习的有效性,因为在音频生成和面部动作之间存在着高度的相关性,两者结合可以相互促进,从而提高整体输出的质量。

在视觉质量评估方面,除了传统的峰值信噪比(PSNR)、结构相似性(SSIM)、Frechet Inception Distance(FID)、Frechet Video Distance(FVD)、ID 相似度(CSIM)以及口型同步(Sync-C)等指标外,我们还引入了两个新的评估标准 ——E-FID(表情 FID)和 P-FID(姿势 FID),以分别衡量生成的面部表情和头部姿势的真实感。具体而言,E-FID 结合了 51 维面部混合形状系数和 4 维眼动参数进行计算,而 P-FID 则通过 6 维旋转 - 平移参数来量化头部姿势的一致性和真实性。

图片
表 2. THG 性能对比

表 2 展示了 OmniTalker 在视觉生成方面的卓越性能。我们的方法在 9 个核心指标中,有 7 个达到了业界领先水平(SOTA),包括最高的 PSNR 和 SSIM,以及最低的 FID 和 FVD。

这些结果表明,我们的方法在视频生成质量方面具有显著优势。尤其在 E-FID 和 P-FID 上,我们的方法相比现有技术实现了一个数量级的提升,突显了其在保持面部运动风格和头部姿态方面的出色能力。这种能力使得我们的方法能够有效地继承参考人物的说话风格,从而实现高保真的音视频克隆。尽管我们的方法在 CSIM 和 Sync-C 指标上获得了次优成绩,但根据我们的经验观察,这些指标倾向于偏好正面视角的视频。相比之下,其他对比方法更倾向于生成正面视角的内容,而忽略了参考视频中实际的面部朝向。我们的方法通过准确捕捉并再现原始视频中的面部方向,提供了更加真实和自然的输出效果。

为了更直观地展示 OmniTalker 建模面部运动风格方面的卓越能力,我们对比了不同方法生成结果中的头部运动累积热图。如图 4 所示,通过将生成的视频与参考视频进行比较,可以清晰地看到,我们的方法生成的热图与真实数据的热图更为接近。图 3 则从时间维度进一步验证了这一点,我们选择头部偏航角(Yaw)作为跟踪指标来观察头部姿态的变化。左侧的红线代表参考序列,右侧展示了由各种方法生成的序列。结果显示,我们方法生成的序列无论是在幅度还是运动频率方面,都与参考序列保持了高度的一致性,同时保留了必要的自然差异,这表明我们的方法能够有效地继承头部姿态的风格特征。相比之下,其他方法生成的头部运动往往不够明显,缺乏动态变化。特别是 StyleTalk 方法直接复制参考姿势序列,虽然保证了与参考姿势的高度一致,但未能考虑语音内容与姿态之间的语义关联,导致生成结果缺乏灵活性和自然感。

图片
图 3. 头部姿态(Yaw)时间变化曲线

图片
图 4. 头部运动累积热图

在实时性方面,我们的方法通过创新地采用 flow matching 技术以及相对紧凑的模型架构(仅包含 8 亿个参数),实现了音视频的实时同步高质量输出。这不仅保证了出色的推理速度,同时也确保了输出的质量优于其他现有方法,如表 2 所示。这种能力使得我们的方法在不牺牲输出质量的前提下,满足了实时应用的需求。

团队介绍

阿里巴巴通义实验室的 HumanAIGC 团队专注于 2D 数字人和人物视频生成的研究,在相关领域内已发表了多篇顶会论文,比如单图驱动角色视频生成 Animate Anyone 以及 Animate Anyone2,单图语音驱动视频生成技术 EMO 以及 EMO2,实时数字人 ChatAnyone 等均出自该团队。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

ChatGPT记忆功能上线,AI助理变身“贴心小棉袄”!

OpenAI近日为ChatGPT推出了全新的记忆功能,让这位AI助手不再是“只记得三秒”的金鱼脑,而是能记住您过往的对话内容,提供更个性化的服务。现在,ChatGPT可以在不同会话中保留您的偏好、兴趣和需求,无需每次都重复说明。无论是写作、旅行计划还是旧项目的延续,ChatGPT都能为您提供更加贴合的建议。

🧠 什么是 ChatGPT 的记忆功能?

ChatGPT 的记忆功能允许 AI 在不同会话之间保留用户提供的信息,例如姓名、偏好、兴趣、写作风格等。这使得用户无需在每次新对话中重复提供相同的信息,从而提升了交互的效率和个性化程度。该功能通过两种方式实现:

  • 用户显式保存的记忆:用户可以明确指示 ChatGPT 记住某些信息。
  • 自动引用聊天历史:ChatGPT 会根据之前的对话内容自动提取和应用相关信息。

目前,该功能已向全球(除英国、欧盟、瑞士、挪威、冰岛和列支敦士登等地区)的大部分 Plus 和 Pro 用户开放,企业和教育账户将在未来几周内获得访问权限。

✨ 功能亮点

  1. 跨会话记忆:ChatGPT 能够记住用户的偏好、兴趣和需求,在后续对话中提供更加贴合的回应。
  2. 个性化互动:AI 会根据用户的历史信息调整回答的语气、风格和内容,提供更符合用户期望的互动体验。
  3. 灵活的记忆管理:用户可以通过设置界面查看、编辑或删除已保存的记忆,也可以选择关闭记忆功能或使用“临时对话”模式,确保隐私和数据安全。

🔧 如何使用和管理记忆功能

  • 启用或关闭记忆功能:在 ChatGPT 的设置中,用户可以选择开启或关闭记忆功能。
  • 查看和管理记忆:通过“管理记忆”选项,用户可以查看所有已保存的记忆条目,并进行编辑或删除操作。
  • 使用临时对话:选择“临时对话”模式,ChatGPT 将不会保存当前会话的任何信息,适用于需要保密的对话场景。

📌 应用场景示例

  • 教育辅助:教师可以让 ChatGPT 记住学生的学习进度和偏好,提供个性化的教学建议。
  • 内容创作:作家或博主可以训练 ChatGPT 采用特定的写作风格,辅助内容创作。
  • 日常助理:用户可以让 ChatGPT 记住个人日程、偏好等信息,作为智能助理使用。

⚠️ 注意事项与隐私保护

尽管记忆功能提升了 ChatGPT 的个性化能力,但也引发了关于隐私和数据安全的关注。OpenAI 表示,用户拥有对记忆功能的完全控制权,可以随时查看、编辑或删除已保存的信息。此外,用户还可以选择关闭记忆功能,确保个人数据的安全。

感谢您的阅读!如果您希望了解更多人工智能领域的精彩资讯,欢迎前往 GPTNB 探索更多相关文章。

“有个男人接近了他”:家长们描述他们孩子在Roblox上遇到的问题

大卫,一位46岁的父亲来自加拿大卡尔加里,最初并没有看到他10岁儿子开始玩Roblox时存在问题。


这个用户生成的游戏和虚拟环境平台近年来的受欢迎程度特别高,尤其是在年轻玩家中。“我们看到这是一种让他在Covid封锁期间保持社交互动的方式,”大卫说,他假设儿子只是通过平台的聊天功能与认识的朋友交流。没过多久,他的父母发现他在半夜独自在房间里与某人交谈。“我们发现一名来自印度的男人接近了他,并教他绕过我们的互联网安全控制,”大卫说。“这个人还劝说我的儿子拍摄妥协性的裸体图像和视频,并通过我们的Google Mini发送。这很难让人理解为什么我的儿子会那样做。我想他感到孤独,以为这个人是一个真正的朋友,我们认为他收到的Roblox礼物让他感到特别。这真的是每位父母的噩梦。”

大卫是全球许多家长中的一员,他们向《卫报》分享了他们的孩子在Roblox上深受负面影响或遭遇严重伤害的经历。许多家长确认了去年一份报告的发现,该报告称Roblox正在让儿童面临诱拐、色情、暴力内容和侮辱性言论的风险。虽然一些家长表示Roblox是孩子们的创造性出口,给他们带来了快乐,甚至改善了他们的沟通和拼写能力,但大多数联系我们的家长都表达了严重的担忧。这些担忧主要集中在他们观察到的孩子惊人的成瘾水平上,还有他们的孩子可以在父母控制下访问的游戏中出现的创伤性内容、诱拐、情感敲诈、欺凌、极端政治图像(例如穿着纳粹制服的头像)以及陌生人在平台上与他们的孩子进行不当交谈。

数字行为专家Revealing Reality的“深感不安”的研究发现,年仅五岁的儿童也能够在玩游戏时与成年人交流。Roblox在回应中承认,儿童在平台上玩耍时可能会接触到有害内容和“坏角色”,该公司声称其正在努力解决这一问题,但这需要行业的广泛合作和政府的干预。虽然该公司表示“深表同情”那些孩子在Roblox上有负面经历的父母,但它并没有对家长关注儿童用户严重的游戏成瘾问题做出回应。最近宣布的一系列额外安全工具,旨在为家长提供更多管理孩子在网页活动的灵活性,但未能打动许多与《卫报》对话的家长。“我认为这些变化不会解决我的担忧,”来自汉默尔亨普斯特的母亲艾米丽说。“新功能很有帮助,但不会阻止孩子接触不当或可怕的内容。人们可以选择他们创建的游戏的年龄评级,而这些评级不会总是合适或准确。我认为Roblox做得不够来保证年轻儿童在平台上的安全。”

“我不允许她与陌生人交朋友。我觉得这就足够了,但事实并非如此。”来自都柏林的母亲内莉说,她9岁的女儿刚刚结束了一系列游戏治疗,以处理她在Roblox上看到的性内容,导致她出现恐慌发作。“我觉得玩是可以的,”她解释道。“有个区域她进入了,里面的人穿着内衣,还有人进来躺在她旁边。”

许多父母觉得Roblox正在利用孩子们的“未发育的冲动控制”,就像一位父亲所说的那样,不断刺激他们赌博和停留在平台上的欲望,导致许多孩子对现实生活中的其他活动失去兴趣。来自伯明翰的珍娜表示,在她的孩子们开始玩Roblox两个月后,他们的“整个生活都被平台完全控制”,她的感觉与许多其他父母的看法一致。“我觉得我和两个瘾君子生活在一起,”她说。“如果他们不在玩,他们就想观看与之相关的视频……当他们被告知要停下来时,就像你在切断他们的最后一剂毒品-大喊大叫、争吵,有时甚至纯粹的愤怒。”

51岁的彼得,一位来自伦敦的艺术家,是三个男孩的父亲,他的14岁儿子因对Roblox和设备的过度迷恋而变得暴力,曾在游戏被关掉时用拳头砸碎一扇窗户。“经营Roblox的人根本不关心父母无法控制这个游戏。我们已经尝试了所有方法,但都没有效果。我们现在正在接受治疗,”他说。Roblox的首席执行官建议父母如果感到担忧,就应让孩子远离平台。然而,来自伯克郡的母亲玛利亚指出,对父母来说,做到这一点是困难的,因为孩子在离线时会感到社交孤立,而平台的盈利元素——解锁更高的游戏等级和个性化功能——已成为孩子们之间的地位象征。Roblox在一份声明中表示:“我们深切同情那些描述自己和孩子在Roblox上负面经历的父母。这不是我们所追求的,并且不反映我们希望为每个人打造的文明在线空间。每天数千万用户在Roblox上拥有积极、丰富和安全的体验,营造了一个促进与朋友连接、学习和发展关键STEM技能的支持环境。虽然我们承认,没有任何在大规模运作的安全系统是完美的,我们不断努力增强和改善我们的系统、流程和政策。”

*姓名已更改
探索更多相关主题
互联网安全
儿童
游戏
新闻
分享
重用此内容



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB