Tabnine发布第二代受保护LLM
性能不逊于领先竞争对手,但LLM基于许可协议许可的代码进行训练,消除了性能和隐私之间的取舍
Tabnine,AI代码助手类别的创始人,今天宣布推出Tabnine Protected 2,这是一个许可安全的大型语言模型(LLM),旨在在确保严格遵守版权和许可规定的同时提供一流性能。{ width=60% }
在生成式AI不断发展的背景下,对版权和许可合规性的担忧仍然是广泛采用的重要障碍。最近的研究显示,近三分之一的首席信息官对这些问题持谨慎态度,有多起诉讼仍在进行中,质疑在未经许可的内容上训练模型的合法性。
Tabnine长期以来一直处于解决这些问题的前沿,提供了在高质量、许可协议许可的代码上训练的专有模型。新模型专门基于许可协议许可的代码进行训练,消除了潜在的法律风险,保持了高标准的数据隐私。知识产权赔偿进一步减轻了任何法律风险。
历史上,限制训练数据意味着接受比没有这些限制进行训练的模型性能更低的结果。从今天开始,这种取舍几乎已经被消除。Tabnine Protected 2代表了在符合许可的AI模型性能方面的重大进步;展示了与在显著更大的训练数据语料库上训练的模型(如GPT-3.5 Turbo)媲美甚至超越的能力。
Tabnine总裁Peter Guagenti表示:“随着Tabnine Protected 2的推出,我们正在为AI驱动的软件开发领域设定新的性能和合规标准。对于那些更多地采取风险规避而不是创新驱动的AI,‘观望’期已经结束。我们的客户现在可以在不牺牲公司标准、灵活采用新模型以及对数据隐私和法律安全性充满信心的情况下享受一流性能。”
使用Tabnine的开发人员可以选择各种LLM来为他们的全套AI软件开发工具提供动力,在实时切换模型以满足特定项目需求。这种灵活性,加上Tabnine对零数据保留的承诺,使其成为唯一提供如此全面控制和隐私的AI代码助手。
Tabnine Protected 2特点:
- 卓越性能和改进的代码准确性:使用HumanEval和MultiPL-E基准进行评估显示更高的pass@1分数,实际测试发现比其他模型更受欢迎,表明卓越性能和对用户的立即价值。
- 严格的数据隐私保护:该模型可以在任何环境中部署,包括本地部署、通过VPC、通过安全SaaS,甚至在完全气隔离的设置中。
- 利用RAG通过上下文改善性能:通过高度先进的检索增强生成(RAG)技术深入了解公司的代码和标准,提供更相关和个性化的响应。
- 广泛的语言支持:支持600多种编程语言和框架,大大改进了之前支持80多种语言的版本。
- 零数据保留:Tabnine确保零数据保留,永不存储或共享客户代码,并保证客户代码不用于训练公共模型。
Tabnine Protected 2对所有Tabnine用户免费提供。开发人员可以通过更新他们的IDE插件访问新模型。对于初次使用Tabnine的人,可以获得Tabnine Pro的90天免费试用。
有关Tabnine Protected 2基准和其他功能的更多详细信息,请阅读Tabnine的博客。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
Tabnine发布第二代受保护LLM