德文

2024-12-25 11:31:36 40

Devin简介

Devin是Cognition公司推出的全球首个全自动化AI软件工程师智能体。它具备卓越的编程与软件开发能力,能够在多个领域协助完成软件开发任务,甚至独立完成整个开发过程。根据SWE-bench基准测试,Devin在解决实际编程问题时的表现明显超越了如GPT-4和Claude 2等其他人工智能模型。

Devin

Cognition公司虽然成立仅两个月,但其团队成员在人工智能领域拥有深厚的技术积累,并且多人曾在国际信息学奥林匹克竞赛(IOI)中获得金牌。该公司已成功完成由彼得·蒂尔的Founders Fund领投的2100万美元A轮融资。

Devin的核心功能

  • 自主学习新技术:Devin能够通过学习文档和源代码,自主掌握尚不熟悉的技术,持续扩展其技能。
  • 端到端构建与部署程序:Devin能全面理解软件开发的各个环节,从前端设计到后端部署,甚至包括将应用发布上线。它可以独立从零开始构建网站、游戏或其他类型的软件项目,并管理相关的工作流程。
  • 自主查找并修复Bug:Devin拥有强大的调试能力,能够检测和修复代码中的错误,甚至是开发者未曾发现的问题。
  • 训练与微调AI模型:除了一般编程任务外,Devin还能够协助训练和微调其他AI模型,展示了其在人工智能领域的深度应用能力。
  • 修复开源库中的问题:Devin能够理解和解决开源社区中的问题,诸如修复bug或实现新功能请求。
  • 为成熟生产库做出贡献:Devin还可以为已有的生产库做出贡献,如修复错误或增加新功能。

Devin

Devin的性能对比

在SWE-bench基准测试中,Devin针对Django和scikit-learn等开源项目中出现的实际问题进行了测试,结果显示它能够准确解决13.86%的问题。这一成绩显著超过了之前1.96%的表现,充分体现了Devin在实际编程问题处理上的强大优势。

与其他人工智能模型对比,Devin的表现也远超GPT-4和Claude 2等知名模型,这些模型在同样的基准测试中通常表现较差。

Devin

如何使用Devin

目前Devin正在进行内测,用户可以访问Cognition官网了解更多信息。对于希望抢先体验的用户,可以填写Devin的内测申请表。

本文转载自互联网,如有侵权,联系 478266466@qq.com 删除。