DataRobot加入IMDA,使LLM评估对AI构建者更易获得

New framework and set of capabilities for benchmarking and red teaming AI evaluation
DataRobot,企业AI平台领导者,今天宣布将LLM评估措施与新加坡政府机构Infocomm Media Development Authority(IMDA)的新倡议融合在一起。图片{ width=60% }


在新加坡Asia Tech x Summit上推出的“ Project Moonshot”倡议提供了帮助AI从业者和系统所有者通过提供共同的基准和红队评估来管理LLM部署风险的新功能。
“在DataRobot,我们的重点是解决信心差距并帮助组织规模化负责任地使用生成AI,” DataRobot首席客户官Jay Schuren说道。“我们很高兴宣布,我们最新的产品发布结合了Project Moonshot的测试工具包及其基准和评估测试。结果是,LLM评估更易获得,有助于规模化使用生成AI的负责任使用,使从业者能够打开和配置警卫模型,以改变LLM的行为和响应。”
Project Moonshot为AI从业者和系统所有者提供了三个核心功能:

  1. 为生成AI解决方案提供自动评估工具,可轻松集成到CI/CD流水线中。
  2. 提供基准库,允许团队通过筛选正确的基准进行与其应用程序相关的评估。
  3. 从越狱到定制攻击,提供AI红队行动的一站式工具。
    “Project Moonshot的开发,作为世界上第一个将红队行动、基准测试和基线测试集成到易于使用平台中的开源工具之一,没有合作伙伴如DataRobot的贡献是不可能的。” AI Verify FoundationGoverning Committee主席Ong Chen Hui博士表示。“Project Moonshot将为开发者提供一个直观的工具包,以测试他们的LLM应用程序。这个新工具包标志着新加坡继续致力于推动全球开源努力,解决生成AI安全问题。”
    “我们很自豪能够支持我们的投资组合公司DataRobot在东南亚的发展之旅,”EDBI首席执行官Paul Ng说。“该公司不仅在新加坡扩大了其业务范围,还促进了造福本地创新生态系统的合作伙伴关系,比如与IMDA的合作伙伴关系。Project Moonshot为本地企业提供了部署生成AI技术的正确工具,有信心展开部署。作为战略投资者,我们致力于为我们的投资组合公司创造价值,同时增强新加坡的创新能力。”
    DataRobot是IMDA认可公司,也是AI Verify Foundation的成员,该基金会于2022年推出了世界上第一个AI治理测试框架和工具包。

Explore AITechPark for the latest advancements in AI, IOT, Cybersecurity, AITech News, and insightful updates from industry experts!



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DataRobot加入IMDA,使LLM评估对AI构建者更易获得

https://www.gptnb.com/2024/06/03/2024-06-02-auto3-rD6jKK/

作者

ByteAILab

发布于

2024-06-03

更新于

2025-03-21

许可协议