Tabnine发布第二代受保护LLM
性能与领先竞争对手相媲美,但LLM是基于许可代码进行训练,消除了性能和隐私之间的权衡关系
今天,AI代码助手类别的发起者Tabnine宣布发布Tabnine Protected 2,这是一个受许可保护的大型语言模型(LLM),旨在提供一流性能的同时确保严格遵守版权和许可规定。{ width=60% }
在生成式AI不断发展的背景下,对版权和许可合规性的担忧仍然是广泛采用的重大障碍。最近的研究显示,近三分之一的首席信息官对这些问题感到担忧,同时还有多起诉讼仍在进行中,质疑在未经许可的内容上进行模型训练的合法性。
Tabnine一直站在解决这些问题的最前沿,提供在高质量、允许许可的代码上训练的专有模型。这个新模型完全是在经允许的代码上训练的,消除了潜在的法律风险,保持了高标准的数据隐私。知识产权赔偿进一步减轻了任何法律风险。
从历史上看,限制训练数据意味着接受比那些没有这些限制的模型训练的模型更低的质量性能。从今天开始,这种权衡几乎已经消除。Tabnine Protected 2代表了遵守许可证的AI模型性能的显著进步;展示了能与甚至超越像GPT-3.5 Turbo这样在相当大的训练数据语料库上训练的模型相媲美的能力。
Tabnine总统Peter Guagenti表示:“通过推出Tabnine Protected 2,我们正在为AI驱动的软件开发设定新的性能和合规标准。”“对于那些出于风险规避而不是创新的更谨慎对待AI的人来说,‘观望’时期已经结束。我们的客户现在可以在不牺牲其企业标准、灵活采纳新模型以及对其数据隐私和法律安全性充满信心的情况下享受一流性能。”
使用Tabnine的开发人员可以选择多种LLM来支持其完整的AI软件开发工具套件,实时切换模型以满足特定项目需求。这种灵活性,再加上Tabnine对零数据保留的承诺,使其成为唯一提供如此全面控制和隐私的AI代码助手。
Tabnine Protected 2特点:
卓越性能和提高的代码准确性:使用HumanEval和MultiPL-E基准测试的评估显示更高的pass@1分数,实际测试发现比其他模型更高的接受度,表明卓越的性能和用户的即时价值。
严格的数据隐私:该模型可以部署在任何环境中,包括本地部署、VPC上、通过安全SaaS,甚至完全隔离的设置中。
使用RAG通过上下文提高性能:采用公司的代码和标准的深度上下文,通过高度先进的检索增强生成(RAG)技术提供更相关和个性化的响应。
广泛的语言支持:支持600多种编程语言和框架,比之前支持80多种语言的前身有了显著改进。
零数据保留:Tabnine确保零数据保留,永不存储或共享客户代码,并保证客户代码不会用于训练公共模型。
Tabnine Protected 2可供所有Tabnine用户免费使用。开发人员可以通过更新其IDE插件来访问新模型。对于那些初次接触Tabnine的人,可以使用Tabnine Pro的90天免费试用。
有关Tabnine Protected 2基准测试和其他功能的更多详细信息,请阅读Tabnine在这里的博客。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
Tabnine发布第二代受保护LLM