GPTNB · AI资讯与技术分享站

2025-04-18发表2025-04-21更新 ByteAILab 8 分钟读完 (大约1267个字)

Kyndryl Consult帮助客户设计、构建和实施AI工作负载
Kyndryl的AI私有云服务支持与NVIDIA及其他生态系统合作伙伴的协作
Kyndryl（纽约证券交易所代码：KD），全球领先的关键企业技术服务提供商，今天推出了一套AI私有云服务和咨询专业知识，旨在为企业级AI解决方案提供无缝的端到端体验，从设计和快速开发到全面运营。{ width=60% }

Kyndryl的AI私有云服务涵盖广泛的咨询服务，使客户能够设计、计划并启动成功的AI项目。这些服务包括识别高投资回报率的行业用例，以支持AI原型的设计和构建，确认生产准备情况，并将客户迁移到生产环境。
为了加速客户采用和实施AI私有云服务，Kyndryl提供针对特定模型和用例量身定制的云部署选项。Kyndryl Consult将就最符合客户AI战略和业务目标的部署选项为客户提供建议。
新的AI私有云服务基于Kyndryl与NVIDIA及其他生态系统合作伙伴的持续合作，在全球范围内建立AI私有云能力，包括最近在日本使用德尔AI工厂和NVIDIA建立的专用AI私有云。
“客户希望在满足性能要求的同时，采用一种可靠、安全和更简单的方法来创建和实施AI和生成式AI工作负载——从公共云上的大型语言模型训练到私有AI上的推理，”Kyndryl全球云业务负责人Nicolas Sekkaki表示。“我们的AI私有云能力扩展了我们的服务组合，可以支持在私有和公共环境中运行的应用程序和解决方案，提供客户期待的更高效率、降低成本和上市时间、提升生产力以及更好的用户体验。”
Kyndryl的AI私有云环境包括围绕容器化、数据科学工具和微服务的服务和能力，以在私有云上部署和管理AI应用。这些工具促进了AI模型的开发、测试和部署，使AI环境更为统一和集成。
多才多艺的Kyndryl AI私有云可以应用于客户在各行业中涌现的各种用例和生成式AI机会，例如：

金融服务：增强数据安全性、风险管理和客户体验，帮助机构获取洞察、检测欺诈并在安全和合规丰富的环境中自动化流程。
医疗保健：安全处理敏感患者数据，同时利用AI能力改进诊断、个性化治疗和运营效率。
技术、媒体和电信：支持虚拟助手、网络性能优化和合成网络数据生成。
制造业：实现预测性维护、数字孪生和质量控制。

采用AI私有云环境的客户将受益于Kyndryl在管理、运行和转型关键应用和系统方面的几十年经验。通过利用其全球联盟合作伙伴生态系统的技术和能力，包括NVIDIA的AI企业软件平台，Kyndryl能够促进企业级AI解决方案的成功开发、实施和使用。
Kyndryl的新AI私有云服务包括AI数据基础和MLOps/LLMOps服务，使客户能够高效地管理其AI数据管道和机器学习操作。Kyndryl还支持统一的企业级方法，以加速AI开发。这种整合为推理开辟了可能性，其中训练过的模型利用其学习模式对新数据进行预测或解决任务，客户可以借此加速其私有AI的旅程。
全球商业和技术领导者正争相利用AI的潜在进步和优势。虽然86%的领导者对其AI实施信心十足，但只有29%的领导者认为其AI准备好应对未来的风险。这一现象突显了全面且可扩展的AI私有云服务的迫切需求，以帮助填补信心与准备之间的鸿沟。
Kyndryl的AI私有云服务优化数据基础设施，具备主权和合规属性，并提供强大的数据隐私措施，使企业能够控制其数据，同时帮助实现监管合规。
了解更多关于Kyndryl的私有云服务的信息。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-18发表2025-04-21更新 ByteAILab 5 分钟读完 (大约730个字)

Orion Innovation在Everest Group数据与人工智能服务评估中获评

Orion Innovation（“Orion”），一家领先的数字化转型和产品开发服务公司，荣获Everest Group在2025年中型企业的PEAK Matrix®评估中颁发的殊荣，成为数据与人工智能（D&AI）服务的主要竞争者。{ width=60% }

Everest对Orion的数据与人工智能（D&AI）服务的认可，证明了其强大而全面的D&AI解决方案。PEAK Matrix®评估2025突显了Orion在数据、人工智能和生成性人工智能方面的创新能力。Orion开发了其前沿的OI Labs.ai平台，作为公司范围内的人工智能知识中心，并继续发展其强大的合作伙伴和联盟生态系统。
Orion Innovation首席技术官Rajul Rana表示：“我们将继续投资并加强我们作为生成性人工智能驱动的解决方案提供者的能力。我们的倡议包括建立治理框架，并将客户的数据战略转变为现代数据平台和工程其AI解决方案。”
被Everest Group认可为“主要竞争者”，强调了Orion在提供创新AI解决方案方面的影响力，帮助组织实现更高的效率、灵活性和业务增长。Orion与客户紧密合作，将其数据转变为战略资产，使其能够做出基于数据的决策，从而推动数据与分析的倡议。Orion不断开发新的框架和加速器，并扩大合作伙伴关系，为客户提供竞争优势。
“Orion Innovation在开发其人工智能和生成性人工智能能力方面进行了大量投资，OI Labs.ai作为这些技术的专用创新中心，”Everest Group合伙人Vishal Gupta表示。“其对AI素养的承诺，特别是关注人力资源和IT等业务职能领域，凸显了其在全体员工中推动AI意识和能力发展的决心，使技术驱动的创新与商业需求相结合。此外，Orion与微软的强大合作关系，在Azure和Fabric方面提供了多种服务，增强了其交付可扩展高效AI解决方案的能力。这些战略投资使Orion Innovation在不断变化的AI领域中良好定位，使其能够为客户创造更大的价值。因此，Orion Innovation在Everest Group的2025年中型企业数据与人工智能（D&AI）服务PEAK Matrix®评估中被认可为主要竞争者。”

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-18发表2025-04-21更新 ByteAILab 6 分钟读完 (大约973个字)

ABBYY推出新的OCR API

为了应对开发者从商业文档中提取可靠且一致的数据的日益压力，ABBYY今天推出了ABBYY Document AI™，该产品通过自助式应用程序编程接口（API）提供。{ width=60% }

ABBYY Document AI API考虑了开发者的使用体验，允许用户仅用少量代码轻松将非结构化商业文档转换为结构化、高度准确的数据，简化了行业领先的光学字符识别（OCR）和智能文档处理（IDP）解决方案的试用、集成、学习和购买过程。

ABBYY工程研发副总裁Nick Hyatt表示：“作为OCR的先锋，ABBYY一直拥有一个充满活力的前沿开发者社区，他们利用我们的先进文档AI创建了变革性的解决方案。我们向他们提供一个新的API，以最小的设置、访问大量社区资源和预训练模型来构建概念验证。ABBYY Document AI API是开发自动化文档工作流的重要一步。”

根据IDC的报告，IDP市场预计将从2023年的24亿美元增长到2028年的105亿美元，年均增长率为34.9%。这一下增长主要得益于云计算的采用、人工智能的成熟和文档AI应用场景的扩展。

IDC企业内容和知识管理策略高级研究经理Amy Machado评论道：“在AI时代，OCR正在经历真正的复兴。开发者在提取文档中的可靠数据时面临困难，通常会首先使用通用的大语言模型来实现这个过程。然而，他们很快会面临幻觉、数据不一致和文档处理错误等挑战，并且通常缺乏对多种语言、手写识别和复杂文档结构的支持。因此，市场需要专门为文档处理设计的解决方案，以优先考虑易于集成、灵活性、可扩展性、准确性和一致性。”

ABBYY Document AI API，最初以技术预览形式提供，赋予开发者使用预训练模型从文档中提取数据并加速复杂业务流程（如KYC、开户、通关、发票处理、报销管理和订单处理）的能力。它提供精确的OCR，完美保留文档的逻辑结构，从而提供AI就绪的数据，这对于在生成AI和检索增强生成（RAG）中解锁深度洞察或构建训练强大语言模型所需的稳固基础至关重要。

有关如何使用ABBYY Document AI API实现快速、准确和轻松的数据提取，以迅速转换任何类型、格式或语言的商业文档、Python、C#、JavaScript和Java的全面SDK以及如何加入ABBYY的Discord社区的信息，请访问并加入预览名单以获取早期访问权：https://digital.abbyy.com/code-extract-automate-your-new-must-have-ocr-api-coming-soon/?itm_source=pressrelease。

1 IDC: 全球智能文档处理软件预测，2024-2028（IDC #US52445224，2024年8月）
Business WireBusiness Wire是新闻机构、记者、投资专业人士和监管机构的可信来源，通过其多项专利的NX网络将新闻直接送入编辑系统和领先的在线新闻来源。Business Wire在全球拥有18个新闻室，以满足传播专业人士和新闻媒体的需求。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-18发表2025-04-21更新 ByteAILab 10 分钟读完 (大约1535个字)

AI强化的人性化多模态视觉辅助系统，上交大开发智能便捷的穿戴设备，登Nature

科技的发展目的是服务于人，故而高新技术的应用也应当以人为本。目前人工智能驱动的可穿戴电子系统没有充分考虑盲人的适应状况，导致采用率很低。

上海交通大学、上海人工智能实验室等开发了一种多模态可穿戴系统，通过融合软件和硬件创新来提高智能穿戴设备的可用性。在软件方面定制了专属 AI 算法用于匹配场景和人类行为需求；硬件方面开发了可拉伸的动感人造皮肤补充反馈。

中国上海交通大学的人工智能研究员 Leilei Gu 表示，这项系统可以部分取代眼睛，尽管目前的实验尚且停留在原型机阶段。

该研究以「Human-centred design and fabrication of a wearable multimodal visual assistance system」为题，于 2025 年 4 月 14 日刊登于《Nature》。

论文链接：https://www.nature.com/articles/s42256-025-01018-6

定制一双眼睛

为盲人开发人工视觉是医疗工作者长期以来的追求。可穿戴式设备通过将环境信息转换为其他感官模式并将其反馈到大脑从而补偿视力的缺失。

目前的系统在执行这类任务时还存在些困难，而全新的系统弥补了这点。通过语音输入控制方向，并利用 AI 算法处理设备摄像头传输的实时图像，保证佩戴者可以安全前进。

在低功耗计算单元上处理好的数据会被反馈到人机界面，移动目标检测算法 YoloV8n 会识别出关键对象。这在实验测试的数据集中表现出卓越的精度（自定义数据集调整后 0.82、预训练 0.59）。

除此之外，RGB 和红外图像的组合还保证了设备在环境光不足与运动模糊等现实问题考验下的发挥。嵌入式惯性测量单元（IMU）避免设备对模糊图像进行不准确的分析。

图 1：可穿戴多模态视觉辅助系统概述。（图源：论文）

测试中，团队使用人形机器人演示系统的视觉功能，达成了在人工视觉的引导下接近苹果的目的。该序列突出了系统的实时视觉识别，为开发以用户为中心的辅助技术奠定了基础。

个性化视觉

为了能够准确检测各种障碍物，例如悬挂、地面和沉没障碍物，研究团队使用了两种方法——全局阈值与地面间隔相结合。

前者检查深度图像中的所有像素，深度在一定阈值区间内的像素被视为障碍物，避免了将地面纳入障碍的范畴；后者将无遮挡地面建模为沿深度图像垂直索引的单调递增函数，在各种条件下都能有效运行，仅需要仔细校准阈值高度。

图 2：避障演示。（图源：论文）

清晰直观的反馈信号有助于大脑轻松解释，从而降低认知负荷。但目前常依赖听觉传达高密度信息，故而目前采用生物相容性编码策略的设计来传达高级场景信息，以此缓解超负荷所带来的不适。

补充语音导航的不足

在导航的路上，仅有语音提示是不够的，相信读者在实际出行的过程中也没少被带入错误的道路，因语音提示不及时的原因也常会误入歧途。

对于没有视觉辅助的盲人群体，只有语音辅助显而易见并不足以满足他们的需要。所以，更加体贴的人造皮肤被专门设计出补充音频反馈。

图 3：人造皮肤运动感知系统。（图源：论文）

该系统的核心组件是一个紧凑的 time-of-Flight（ToF）传感器，当距离小于预定义的阈值时，致动器会振动以刺激皮肤。制动器设计纤薄，以求提高能源利用效率。

驱动器与皮肤保持的间距同时保证了执行器的震动与空气流通，变相减少了摩擦损耗。传感器位于手部，根据手指的不同动作切换对应的功能。

团队放出了实际测试视频，在演示中，所有参与者都能够在室内导航，他们的步行速度与使用手杖时相似。

在另一项试验里，8 名参与者在现实环境中测试该设备，包括在城市街道上行走和穿过摆满家具的会议室，这项技术在这些场景中均表现良好。

视频测试链接

不过，目前这项技术尚且停留在原型机阶段，但是相信在不久的未来，一定会为盲人的生活带来新曙光。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-18发表2025-04-21更新 ByteAILab 15 分钟读完 (大约2184个字)

本周日不见不散！ICLR 2025北京论文分享会最后报名了

从 OpenAI o1 到 DeepSeek R1，推理模型进入到了全新的发展阶段，展现出来的「慢思考、强推理」能力正在加速从语言智能到认知智能的进程，并构筑起未来 AGI 的重要基石。同时，学界对大语言模型范式的探索仍在继续，扩散模型不断向主流的自回归架构发起挑战。

当然，在 2025 智能体元年，大语言模型（LLM）驱动的智能体借助手机等移动终端的落地，深刻改变了人机交互范式。多模态大模型的竞争也趋于白热化，提升跨模态理解与生成能力的同时注重低成本和低门槛应用。

为让从业者全面了解 AI 社区涌现的最新创新成果和发展趋势，机器之心计划 4 月 20 日在北京举办「ICLR 2025 论文分享会」，围绕着训练推理、多模态、Agent 等热门主题邀请顶级专家、论文作者与现场参会观众共同交流。

作为机器学习和深度学习领域的顶级会议，ICLR 具有极高的含金量，每年都会吸引大量研究机构和高校参会。今年，ICLR 2025 共接收 11,565 份投稿，录用率为 32.08%。

作为一场为国内 AI 人才打造的盛会，本次论文分享会设置了 Keynote、论文分享、圆桌对话、Poster 交流等丰富环节。今天，论文分享会的全日程、Keynote 分享嘉宾、演讲主题以及圆桌嘉宾正式公布，感兴趣的读者可以继续扫描文中二维码报名，截止日期到4月18日24:00。

Keynote 嘉宾及演讲主题

上午 Keynote：陈键飞基于量化稀疏的高效训练推理：理论及算法

分享人介绍：陈键飞，清华大学计算机系准聘副教授。2010-2019 年获清华大学学士和博士学位。从事高效机器学习研究，谷歌学术引用 5000 余次。担任 IEEE TPAMI 的编委，担任 ICLR 等会议领域主席。获得 CCF 青年人才发展计划、清华大学学术新人奖等。

分享摘要：大模型所需计算成本高昂，而低精度、稀疏等高效训练推理方法均在原有计算基础上引入了近似，可能会引起精度损失。本报告将介绍近似梯度下降理论，该理论可以为高效的近似训练方法的收敛性、收敛速度提供理论保证。基于该理论，将分别介绍通过量化和稀疏两条技术路线设计的前馈神经网络计算加速、注意力计算加速、激活压缩、优化器压缩、通信压缩等高效训练推理算法。将从机器学习的角度出发，介绍高效训练的过程中遇到的训练不稳定等问题及克服方法。

下午 Keynote：李崇轩 LLaDA：语言模型新范式

分享人介绍：李崇轩，中国人民大学高瓴人工智能学院准聘副教授、博士生导师，2010-2019 年获清华大学学士和博士学位。主要研究机器学习、深度生成模型，代表性工作部署于 DALL・E 2、Stable Diffusion、Vidu 等生成式大模型。获国际会议 ICLR 杰出论文奖、吴文俊优秀青年奖、吴文俊人工智能自然科学一等奖、中国计算机学会优秀博士论文等，主持国家自然基金重大研究计划培育项目、面上项目等，担任 IEEE TPAMI 编委、软件学报编委和 ICLR、NeurIPS 等国际会议的领域主席。

分享摘要：本次报告聚焦一个问题：自回归是否是通向当前乃至更高水平的生成式智能的唯一范式？本次报告首先从统一概率建模的视角总结当前基础生成模型的发展，并从这个视角出发指出大语言模型的性质（如可扩展性、指令追随、情景学习、对话、无损压缩）主要来自于生成式准则，而非自回归建模独有。基于这些洞察，本次报告基于掩码的扩散语言模型的技术路线，包括基础理论和扩展定律。最终，基于前期成果，训练 8B 扩散大语言模型 LLaDA（Large Language Diffusion with mAsking）。在 20 多个语言、代码、数学等评测集上，LLaDA 8B 全面超过 LLaMA 2，对标 LLaMA 3。并且 LLaDA 通过非自回归的方式，展示了令人惊讶的可扩展性和多轮对话能力。这些结果不仅挑战了自回归的地位，更加深了我们对生成式人工智能的理解。

圆桌讨论嘉宾

这场分享会中，我们特别设置了一场「LLM 驱动的 Agent：技术瓶颈与融合路径」主题圆桌，邀请了四位专家学者现场探讨。

主持人：张群英 ICT 产业观察家，茶思屋科技网站总编

对话嘉宾：

李崇轩，中国人民大学高瓴人工智能学院准聘副教授、博士生导师，2010-2019 年获清华大学学士和博士学位。主要研究机器学习、深度生成模型，代表性工作部署于 DALL・E 2、Stable Diffusion、Vidu 等生成式大模型。

李庆，北京通用人工智能研究院机器学习实验室主任，2022年博士毕业于UCLA。他的研究方向包括大模型智能体，多模态理解，具身智能等。

吴承霖，DeepWisdom 创始人兼 CEO。拥有十亿级用户的大规模 AI 落地经验。

杨林易博士自2017年起在都柏林大学攻读博士学位，在人工智能领域取得了一系列具有国际影响力的学术成果。

Poster

在本次论文分享会中，将会有一批论文作者进行论文分享与 Poster 展示，感兴趣的读者可以通过下图了解具体信息：

此次论文分享会也将在机器之心视频号以及黄大年茶思屋科技网站两个平台进行直播，欢迎大家关注、预约。

合作伙伴介绍

黄大年茶思屋科技网站
黄大年茶思屋科技网站是致力于推动科学与技术交流的开放平台。我们汇聚全球科学家、研究人员和技术专家，共同探讨最前沿的学术话题，分享最新的科研成果，激发创新思维的火花。
网址：https://www.chaspark.com

腾讯青云计划
腾讯青云计划聚焦 AI 大模型等十大技术领域，面向全球招募顶尖实习生和毕业生。
青云官网：https://join.qq.com/qingyun.html

真格基金
真格基金创立于 2011 年，是国内最早的天使投资机构之一。
网址：https://www.zhenfund.com/

博世集团
博世集团是全球领先的技术和服务供应商，在智能出行、工业技术、能源与建筑技术等领域持续深耕。
网址：https://www.bosch.com.cn/careers/

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-17发表2025-04-17更新 ByteAILab 4 分钟读完 (大约529个字)

Spotify在用户全球报告问题后重新运行

数万名Spotify用户在全球报告无法在应用上播放音乐，该流媒体平台周三遭遇数小时的技术问题。

监测平台Downdetector显示，周三下午有超过48,000条关于Spotify的故障报告。在英国，报告Spotify无法正常运行的用户数量在下午1:30达到峰值，问题在30分钟前开始。到了下午3点，这一数字降至约10,000。Spotify在两个小时后确认服务已经恢复正常。该流媒体平台在下午5:08在社交平台X上发布消息：“一切恢复正常 – 感谢您的耐心。如果您仍然需要帮助，请联系@SpotifyCares。”用户表示，他们能够播放下载到设备上的音乐，但无法查看艺术家或使用应用的搜索功能。其他人反映该平台运行缓慢或没有响应。在尝试搜索音乐时，Spotify似乎超时，显示“出了点问题”的信息，并带有一个刷新按钮。许多用户在社交媒体上表达了他们的沮丧，称此次故障打断了他们的健身或学习计划。一位来自瑞典的流媒体平台发言人表示：“Spotify于上午6:20（东部时间）左右发生故障。至上午11:45（东部时间），Spotify已恢复正常运行。”稍早之前，该发言人曾表示公司“已意识到故障，并正在尽快解决”问题，并补充说：“关于这是一场安全攻击的报告完全不准确。”Spotify没有进一步提供有关故障原因的信息。Spotify全球拥有超过6.75亿用户，该公司告诉BBC“搜索方面的问题已得到解决”，并正在向用户推出更新。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-17发表2025-04-17更新 ByteAILab 7 分钟读完 (大约1052个字)

谷歌因涉嫌排挤竞争对手在英国被起诉50亿英镑

谷歌在英国因涉嫌在互联网搜索市场排挤竞争对手并滥用这一优势向企业过高收费而被起诉，索赔金额高达50亿英镑。

周三在竞争上诉法庭提交的集体诉讼指出，这家美国公司采取了措施，使其在搜索查询中展示的广告收取的价格高于公平市场下的价格。

据称，谷歌（属于Alphabet公司）与手机制造商签订合同，要求在安卓设备上预装谷歌搜索应用和Chrome浏览器，并支付苹果公司，使其在iPhone上成为默认搜索引擎，目的是排挤竞争对手。该诉讼由竞争法专家Or Brook代表数千家企业提起，指控谷歌确保其搜索引擎在功能和特性上优于竞争对手的广告产品。

谷歌的一位发言人表示：“这又是一起投机和机会主义的案件，我们将坚决反对。”她进一步表示，消费者和广告商使用谷歌是因为它有用，而不是因为没有替代品。

Brook表示，企业几乎没有选择，只能使用谷歌广告来宣传他们的产品和服务。“全球范围内的监管机构将谷歌视为垄断企业，确保在谷歌的首页获得一个位置对于可见性至关重要，”她在一份声明中说。 “谷歌一直在利用其在一般搜索和搜索广告市场的主导地位，向广告商收取过高费用。”

英国竞争与市场管理局（CMA）自1月起对谷歌的搜索服务进行调查，调查仍在进行中，包括对其对广告市场影响的调查。CMA当时表示，数以百万计的人和企业依赖谷歌的服务，谷歌的搜索服务占据了90%的市场份额，超过200,000家英国企业利用它进行广告宣传。

谷歌在全球范围内面临多起与其数字广告市场主导地位相关的竞争调查和诉讼。自9月份以来，它正在参与第二场反垄断审判，以确定其是否非法垄断数字广告行业，此前在8月份的一个标志性案件中败诉，目前正在上诉。

在美国政府的投诉中，一位谷歌广告高管将该公司的商业模式与高盛或花旗银行拥有纽约证券交易所进行了比较。若在该审判中败诉，谷歌可能被迫拆分其业务的部分并剥离一些广告技术，这将打击其主要收入来源，并对更广泛的科技产业和在线出版商产生深远影响。

3月份，欧盟委员会指控谷歌违反其数字市场的竞争规则，优先显示指向Alphabet自家服务的搜索结果，侵犯了对第三方服务“透明、公平和非歧视”的待遇要求。

根据欧盟数字市场法的规定，违反者可能面临全球收入的10%的罚款，若再次违规导致罚款提高至20%。

唐纳德·特朗普曾试图施压政府和机构停止对科技公司的竞争诉讼，并表示他将把对美国公司进行的任何监管行动纳入对外货物征收大规模关税的决策中。

本月有消息称，英国政府正在考虑降低其数字服务税的法定税率，该税在2020年对包括谷歌、亚马逊和苹果在内的科技公司的收入征收2%的税，年收入约为8亿英镑，以试图安抚美国总统。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-17发表2025-04-17更新 ByteAILab 5 分钟读完 (大约804个字)

Phantom Neuro获得奥托博克领投的1900万美元A轮融资

投资将加速Phantom X的临床试验和商业化进程，奥托博克将加入Phantom Neuro董事会
Phantom Neuro，一家推进人机界面的神经科技公司，今天宣布完成一轮超额认购的1900万美元A轮融资，由全球假肢、矫形和外骨骼技术的领导者奥托博克（Ottobock）领投。{ width=60% }

此次融资还包括现有投资者Breakout Ventures、Draper Associates、LionBird Ventures、Time BioVentures和Risk and Return的参与，以及新投资者Actual VC、METIS Innovative、e1 Ventures、Jumpspace、MainSheet Ventures和Brown Advisory的加入。
此次投资使Phantom Neuro的总融资达到2800万美元，并标志着公司在将Phantom X机器人控制平台带入患者生活的使命中的一个里程碑。资金将支持前临床测试、首个人体试验的完成、监管提交，以及为更广泛的控制应用进行更深入的研发，超越假肢的应用。
“奥托博克的支持凸显了神经科技、假肢和机器人技术日益融合的趋势，”Phantom Neuro创始人兼首席执行官Connor Glass博士表示。“数十年来，奥托博克一直处于为数百万人的恢复移动能力的最前沿。通过与他们的合作，我们正在加速Phantom X的市场路径，并为我们渴望的未来打下基础：助行设备真正作为人体的自然延伸。”
作为投资的一部分，奥托博克将加入Phantom Neuro的董事会，带来在全球假肢和外骨骼市场的专业知识，以支持Phantom的商业化努力。
“Phantom Neuro正在改变人们与助行设备的互动方式，他们的微创神经接口技术代表了该领域的一个激动人心的进步，”奥托博克首席执行官Oliver Jakobi表示。“我们的投资反映了我们作为医疗技术先锋在假肢市场领先的雄心，确保患者能够获得最有效的解决方案。我们期待与Phantom Neuro合作，扩大这一突破性技术的普及。”
此次融资是在Phantom Neuro最近获得美国食品药品监督管理局（FDA）授予的突破性设备认证和目标加速通道（TAP）认证之后进行的。这些认证验证了该平台改善患者结果的潜力，通过提供类人控制的假肢和辅助设备，并帮助加速监管审批。
此外，Phantom Neuro的ASCENT研究表明，Phantom X在解码实时手势方面，达到了94%的准确率，涵盖11种关键的手腕和手部运动，进一步支持其恢复功能和独立性，帮助有行动障碍的个体。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-17发表2025-04-17更新 ByteAILab 20 分钟读完 (大约2980个字)

Deepgram推出Aura-2

Aura-2在对话企业应用案例的偏好测试中击败了ElevenLabs、Cartesia和OpenAI，提供无与伦比的清晰度、速度和成本效益的自然、上下文感知语音合成，适用于实时企业互动。{ width=60% }

Deepgram是领先的企业用语音AI平台，今天宣布发布其下一代文本到语音 (TTS) 模型——Aura-2，专为关键业务环境中的实时语音应用而设计。Aura-2经过优化，具有清晰、一致和低延迟的性能，可通过云或本地API进行部署，使开发人员能够构建可扩展的类人语音体验，适用于企业中的自动化交互，包括客户支持、虚拟代理和AI驱动的助手。Aura-2建立在Deepgram Enterprise Runtime之上——同样支撑该公司的行业领先的语音到文本 (STT) 和语音到语音 (STS) 功能，为企业提供控制、适应性和性能，以满足生产级语音AI的部署和扩展需求。通过Aura-2，Deepgram在企业语音技术领域进一步巩固了其领导地位，使企业能够在大规模上提供自然、响应迅速和上下文准确的对话。目前，已有超过200,000名开发者和1,200家公司，包括财富500强企业和像Jack in the Box、Vapi及OneReach.ai这样的语音AI初创公司在使用Deepgram。

“我们依赖Deepgram的语音识别在规模上支持实时语音交互，因此能够在同一企业级基础设施中部署TTS是非常有吸引力的，”Vapi首席技术官Nikhil Gupta表示。“从单一供应商获取STT和TTS显著降低了集成复杂性和延迟，为构建大规模对话AI的团队提供了更顺畅的体验。”

“Aura-2出色的清晰度和自然性显著提升了我们的对话AI解决方案，使客户互动更加流畅和引人入胜，”Cognigy人工智能转型高级副总裁Thys Waanders表示。“Deepgram能够以规模化的方式提供实时、领域特定的发音，确保我们满足企业呼叫中心在高效和降低成本方面的复杂需求。”

弥合差距：企业优化的语音AI
在当今的TTS领域，娱乐导向模型与企业级语音系统的运营需求之间存在显著差距。虽然以娱乐为导向的TTS平台是针对故事讲述、角色声音和情感表达交付进行训练和优化的，但当应用于企业用例时，它们却无法满足需求。企业应用需要的不仅仅是自然声音——它们还要求领域特定的发音、专业语调、一致的上下文处理，及在需要完全部署控制的环境中，能够可靠、经济高效地运行。Aura-2弥合了这一差距，提供为企业关键环境的规模、精确和弹性所设计的高质量、上下文感知的语音。与针对创造性表达进行优化的娱乐导向系统不同，Aura-2反映了企业语音AI的优先事项，在关键维度上提供优势：

领域特定的发音卓越——Aura-2确保精确处理行业术语，准确发音医疗术语、金融行话、产品名称和复杂数字，无需手动标记。这一内置的准确性消除了对广泛发音词典或手动干预的需求，确保在专业领域清晰沟通，其中精确性至关重要。
专业语音质量和自然性——Aura-2提供40多种覆盖美国英语和本地口音的声线，发布真实的、适合商业的语音，避免了娱乐导向TTS中常见的过于戏剧化的语调。组织可以选择与其品牌身份一致的声线角色，从“充满同情和魅力”到“冷静而专业”，在所有客户接触点保持一致。
上下文感知的表现——Aura-2根据上下文智能调整节奏、停顿、语调和表达——无论是拨打电话号码、处理支持升级还是进行交易交互，结果都是平滑、连贯的语音，音量均匀，发音清晰。

这些语音和交付优势转化为真实用户偏好。在企业场景的面对面比较中，Deepgram几乎在60%的情况下胜出。

实时性能——Aura-2针对现实企业工作负载进行了优化，提供低于200毫秒的首次字节时间 (TTFB)，实现超响应的交互。它高效支持成千上万的并发请求，同时在高容量部署中维持持续低延迟和高质量语音输出——从呼叫中心到虚拟助手。对于具有严格安全或数据驻留要求的团队，在本地或VPC中部署Aura-2不仅确保完整控制——还可以通过消除往返云端的延迟来减少延迟。

成本效益——Aura-2以透明的定价提供企业级语音，优化了大宗使用。每1000个字符仅需0.030美元，相较于ElevenLabs Turbo（0.050美元）和Cartesia Sonic（0.038美元）提供可观的节省。Deepgram的基于使用量的模式包括所有40多种声音，以单一费率计费，无隐藏费用，并提供分层的企业定价，从而显著降低高容量实施的成本。这种方法消除了质量与成本的权衡，使企业能够在不牺牲性能的情况下，在所有接触点提供一致的声音体验，以控制成本。

“我们的客户需要的不仅仅是听起来不错的声音——他们需要在专业环境中精确、可靠地交流的声音，”Deepgram首席执行官Scott Stephenson表示。“Aura-2实现了自然语音与企业级准确性的完美平衡，使组织能够创建真正强化客户互动的语音体验，同时维护运营效率。”

“Aura-2为企业级TTS设定了新的标杆。它所提供的清晰、一致和低延迟的体验为我们的AI代理体验带来了变革，”Stack AI联合创始人Bernardo Aceituno表示。“凭借Deepgram的语音合成，我们能够构建不仅听起来更人性化，而且在企业所需的可靠性中表现出色的工作流程。”

“我们选择Deepgram是因为它提供了我们支持大规模实时交互所需的速度、成本效益和准确性，涵盖从STT到TTS，”LockedIn AI首席执行官Caesar Gui表示。“Aura-2的响应性和质量让我们能够创建语音自然的AI代理——同时从单一供应商获得整个语音堆栈意味着更快的迭代和更少的集成麻烦。”

企业级架构用于实时应用
Aura-2由Deepgram Enterprise Runtime (DER) 提供支持——这是一个专为企业级性能定制的基础设施层，运行Deepgram所有的语音模型。DER专门设计用于实时协调语音AI，提供生产规模部署所需的速度、可靠性和适应性。主要功能包括：

自动模型适应——通过高价值数据策划、合成数据生成和自动训练持续改善表现，使语音模型随着业务演变。
模型热切换——允许在生产中即时更换模型而无须停机，支持实时个性化和快速迭代。
极端压缩——专有无损压缩显著减少计算负载和运营成本，同时不影响质量。
灵活部署——支持公共云、私有云 (VPC) 和本地环境，使企业能够控制和灵活地整理内部基础设施、合规政策和数据治理标准。
为实时而非回合制设计——旨在流畅、人性化的对话，具备中断处理和思维结束检测，支持动态、重叠的语音模式。

通过运行在DER上，Aura-2继承了一个为关键任务性能构建的企业级基础。此架构优势意味着组织可以部署先进的TTS能力，同时维护Deepgram可信平台所定义的安全、可靠性和可扩展性的运营标准。不同于限于云端的供应商，Deepgram提供真正的部署灵活性——在云、VPC和本地环境中实现对称性能，因此企业可以在没有权衡的情况下满足安全和基础设施要求。企业获得的不是运营特征迥异的独立系统，而是一个为生产环境设计的统一语音AI基础设施。

Deepgram在STT方面的领导地位增强了TTS功能
Deepgram在STT领域的公认领导地位使Aura-2在提供准确、生产就绪的TTS方面具备了明显优势。通过运行在驱动Nova-3语音识别和对话AI的同一企业运行时上，Aura-2受益于共享学习、统一部署和无缝的开发者体验。Deepgram语音AI堆栈的这种深度集成消除了通常因为将多个供应商的工具拼接在一起而出现的操作复杂性和调试挑战。

“我们多年来开发Nova-3和其他STT模型使我们对现实世界的语音模式有了深刻的洞察，”Deepgram产品副总裁Natalie Rutgers表示。“借助Enterprise Runtime，Aura-2直接利用我们的声学模型和发音数据集，实时提供精确、特定于行业的语音合成。”

这一统一架构允许持续的跨模型学习，语音识别中的改进自动增强语音合成，利用共享运行时。这一平台根据您的特定行业术语和用户互动不断学习和适应，将孤立的语音组件转变为一个随着每次交互不断增强的统一语音AI平台。对于企业来说，这意味着更可衡量的性能：系统间一致的发音、减少的端到端延迟和实时模型自定义——所有这些都出自于Deepgram所定义的同样可靠的平台。

亲自体验Aura-2
马上开始构建企业级的TTS。通过我们的互动游乐园立即体验Aura-2，或在deepgram.com上探索深入的产品能力。新用户可获得200美元的免费积分——足以生成超过1300万字符（约220小时的语音）。迈出转型您的语音应用的第一步，使用Deepgram的行业领先技术。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

2025-04-17发表2025-04-17更新 ByteAILab 5 分钟读完 (大约714个字)

Barracuda任命Ketan Tailor为首席客户官

资深领导者在快速增长的业务中提升客户体验
Barracuda Networks, Inc.是一家领先的网络安全公司，为各种规模的企业提供全面保护，以应对复杂威胁。{ width=60% }

今天宣布任命Ketan Tailor为首席客户官。Tailor拥有20多年领导经验，在Barracuda这个关键时刻加入，以提升客户体验举措，同时加速其网络安全平台的增长。
“凯坦是一位富有激情和远见的领导者，拥有建设世界级以客户为中心的组织、推动增长、促进创新和培养长期忠诚度的成功经验，”Barracuda Networks首席执行官Hatem Naguib表示。“他在客户成功、支持及全球运营扩展方面的深厚专业知识，将在我们进入下一个增长阶段时发挥关键作用。Ketan的领导力将确保我们不仅满足客户不断变化的需求，而且继续超越他们的期望，为我们的全球扩展提供卓越的价值。”
在加入Barracuda之前，Tailor曾担任Ping Identity的全球支持副总裁，在那里他成功地将支持职能转变为高增长的收入引擎，并在后并购整合中发挥了关键作用。他的领导对扩展全球运营并通过创建分层服务提供，即为客户提供适当级别的参与和支持，从而提高客户满意度至关重要。
Tailor还曾担任xMatters的客户成功与支持副总裁，期间在被Everbridge收购时实施了全面的客户旅程框架，开发了预测性客户健康评分，并领导了将客户转变为品牌倡导者的策略。在此之前，他还在Sophos领导美洲的支持运营，在那里推动了运营效率并建立了可以扩展的全球支持团队，从而提升服务交付，缩短响应时间。
“这是一个令人振奋的时刻，Barracuda及其合作伙伴和客户将迎来一个新的阶段，我很高兴能加入这样一个创新且以客户为中心的组织，”Tailor表示。“我渴望与这支才华横溢的团队合作，进一步增强客户体验，推动有意义的增长，并在我们继续塑造网络安全的未来时，为客户提供更大的价值。”

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

链接

分类

最新文章

归档

标签

订阅更新