DataRobot加入IMDA,使LLM评估对AI构建者更加可访问

新框架和一套能够用于基准测试和红队测试AI评估的能力
企业AI平台领导者DataRobot今天宣布,与新加坡政府机构新加坡信息通信媒体发展局(IMDA)的一项新倡议对齐,集成了LLM评估措施。图片{ width=60% }


在新加坡Asia Tech x Summit上推出的“Project Moonshot”计划提供了新的能力,帮助AI从业者和系统所有者通过提供一个共同的基准测试和红队测试评估框架来管理LLM部署风险。

DataRobot首席客户官Jay Schuren表示:“在DataRobot,我们的重点是解决信心差距,并帮助组织扩大生成式AI的负责任使用。” “我们很高兴宣布,我们的最新产品发布包含Project Moonshot的测试工具包及其基准测试和评估测试。结果是,LLM评估变得更加可访问,并有助于扩大生成式AI的负责任使用,使从业者可以打开和配置防护模型,以改变LLM的行为和响应。”

Project Moonshot为AI从业者和系统所有者提供了三个核心能力:
易于集成到CI/CD流水线中的生成式AI解决方案自动化评估工具。通过策划正确的基准测试,使团队能够运行与其应用相关的评估的基准存储库。从越狱到定制攻击,一站式的AI红队工具。

“作为全球首个将红队测试、基准测试和基线测试集成到易于使用平台中的开源工具之一的Project Moonshot的开发,没有DataRobot等合作伙伴的贡献就不可能实现。” AI Verify Foundation管理委员会主席Dr Ong Chen Hui说道。“Project Moonshot将为开发人员提供直观的工具包,用于测试其LLM应用程序。该工具包标志着新加坡继续致力于促进解决生成式AI安全问题的全球开源努力。”

EDBI首席执行官Paul Ng表示:“我们很自豪能够支持我们的投资组合公司DataRobot在东南亚的增长之旅。” “该公司不仅在新加坡扩大了业务范围,还促进了有利于本地创新生态系统的合作,例如与IMDA的合作。Project Moonshot为本地企业提供了部署生成式AI技术的正确工具。作为战略投资者,我们致力于为我们的投资组合公司创造价值,同时增强新加坡的创新能力。”

DataRobot是IMDA认可公司,也是于2022年推出世界首个AI治理测试框架和工具包的AI Verify Foundation的成员。

探索AITechPark,了解人工智能、物联网、网络安全、AITech新闻以及行业专家的深入更新!

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DataRobot加入IMDA,使LLM评估对AI构建者更加可访问

https://www.gptnb.com/2024/06/01/2024-05-31-auto3-GT1TZq/

作者

ByteAILab

发布于

2024-06-01

更新于

2025-03-21

许可协议