aiOla的AI借助额外训练适应任何行业术语

aiOla的专有模型在OpenAI的Whisper基础上取得了显著进展,实现了在转录领域特定对话时识别准确性增加45%。图片{ width=60% }


aiOla作为演讲识别技术的领军者,宣布推出一种新的AI模型,该模型利用他们对行话检测的突破性研究,使其能够立即适应任何行业的独特词汇,而无需重新训练。aiOla通过利用专门为其业务行话和需求量身定制的演讲识别技术,使企业能够有效捕获以往未被捕获的宝贵数据。aiOla的技术取代了先前用纸和笔完成的手动流程,同时支持100多种语言,甚至可以准确转录重口音的演讲。

现成的演讲识别模型,包括领先的解决方案OpenAI的Whisper,在行业使用中存在不足,因为它们无法准确转录领域特定术语。为解决这些限制,通常需要针对每个行业独特要求的广泛训练。训练最先进的AI模型的初始成本可能达数亿美元,即使微调模型的过程也是极其资源密集的,需要专业的AI专业知识。

aiOla的模型利用他们的专有技术提供企业需要的灵活性,涵盖制造业、供应链等所有行业领域。通过一种利用提示指导的创新模型架构,它有效地纳入领域特定行话,实现了零重新训练的定制AI演讲识别系统。

aiOla已开始在财富500强公司中部署这项技术,涉及物流、航运、制造、维护和库存控制等领域,为任何规模的公司提供量身定制的服务,同时产生即时可衡量的投资回报。

aiOla的执行主席Mitch Garber表示:“每个行业的企业都清楚地意识到,采用AI以保持竞争优势的迫切需求,但他们不知道从哪里开始。”。文本基础的AI解决方案非常适合办公环境,而在工业环境中,语音界面才是首选,因为它们可以无缝集成到现有工作流程中,收集以前未被捕获的口头数据。以往的AI语音识别模型无法适用于业务用例,因为它们无法理解行话。如今,aiOla正在通过提供可立即适应您特定行业、组织或团队独特行话的定制AI模型来改变这一状况。

aiOla已发布了一项研究,概述了他们实现即时行话识别的新方法。他们采用了两步方法:首先,通过aiOla的先进关键词检测模型检测特定术语的存在,然后利用这些信息由他们基于Whisper的模型来增强其整体演讲识别能力,正确检测行话词汇或术语。“对于这个用例,我们决定加强现有最准确的演讲识别模型,即OpenAI的Whisper,”aiOla的研究副总裁Gil Hetz说。“然而,您可以将这种方法应用于任何演讲识别模型,包括Meta的MMS模型和专有模型,进一步释放提升最高性能的语音到文本模型的潜力。”

aiOla的模型能够即时理解行话,首先通过冻结主要演讲识别模型,然后添加专有自适应层。这个适配器经过一次性训练,指导它有效地利用一个行话词汇,同时保留模型的核心通用演讲识别能力。在训练后,可以将行话词汇即插即用到不同部门的行话中,实现在识别行业特定语言和一般演讲方面的最先进表现。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

aiOla的AI借助额外训练适应任何行业术语

https://www.gptnb.com/2024/07/09/2024-07-08-auto3-seJSTT/

作者

ByteAILab

发布于

2024-07-09

更新于

2025-03-21

许可协议