DataRobot加入IMDA,使LLM评估对AI构建者更易访问

新框架和一套功能,用于基准测试和红队对抗AI评估
企业AI平台领导者DataRobot今天宣布,与新加坡政府机构新加坡信息与媒体发展局(IMDA)新倡议对齐的LLM评估措施集成。图片{ width=60% }


在新加坡亚洲科技峰会上发布的“Project Moonshot”倡议提供了帮助AI从业者和系统所有者管理LLM部署风险的新功能,通过提供基准测试和红队评估的共同框架。
数据机器人首席客户官Jay Schuren说:“在DataRobot,我们的重点是解决信心缺口,帮助组织扩大生成式AI的负责任使用。” “我们很高兴地宣布,我们最新的产品发布包含Project Moonshot的测试工具包及其基准测试和评估测试。结果是LLM评估更易访问,帮助扩大生成式AI的负责任使用,使从业者能够打开和配置守护模型以改变LLM的行为和响应。”
Project Moonshot为AI从业者和系统所有者提供了三个核心能力:

  • 为生成式AI解决方案提供自动化评估工具,可轻松集成到CI/CD管道中。
  • 提供基准库,让团队通过策划正确的基准测试来运行与其应用程序相关的评估。
  • 一个一站式工具,用于AI红队对抗,从越狱到定制攻击。
    “Project Moonshot的开发,是全球首个将红队,基准测试和基线测试集于一体的易于使用平台的开源工具之一,如果没有DataRobot等合作伙伴的贡献是不可能的。”,AI Verify基金会的理事会主席Dr Ong Chen Hui说。“Project Moonshot将为开发者提供一个直观的工具包,用于测试其LLM应用程序。这个新工具包标志着新加坡继续致力推进全球开源努力以解决生成式AI安全问题。”
    “我们为支持我们的投资组合公司DataRobot在东南亚的增长之旅感到自豪。”,EDBI首席执行官Paul Ng说。“该公司不仅扩大了在新加坡的业务范围,还促进了与IMDA的合作等惠及当地创新生态系统的合作。Project Moonshot为本地企业提供了部署生成式AI技术的正确工具,让他们充满信心。作为战略投资者,我们致力于为我们的投资组合公司创造价值,同时增强新加坡的创新能力。”
    DataRobot是IMDA认可公司,也是AI Verify基金会的成员,该基金会在2022年推出了世界首个AI治理测试框架和工具包。
    在AI TechPark 探索最新的AI、物联网、网络安全、AI技术新闻及行业专家的见解!


感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DataRobot加入IMDA,使LLM评估对AI构建者更易访问

https://www.gptnb.com/2024/06/04/2024-06-03-auto3-H8PGum/

作者

ByteAILab

发布于

2024-06-04

更新于

2025-03-21

许可协议