2026年06月17日 星期三 行业资讯门户
首页 行业资讯 产品中心 关于我们 联系我们
首页 » 行业资讯 » Test
标签「Test」相关报道
资讯列表

  新智元报道  【新智元导读】AI写代码已从补丁阶段进入全流程工程评估,SWE Atlas 首次系统评测代码理解、测试编写与重构等核心能力。结果显示,尽管GPT-5.4等模型能完成基础功能,但在代码健康、边界覆盖和跨文件协调上仍有明显不足。当全世界都在用SWE-Bench类基准为编程智能体封神时,Scale AI抛出了一颗深水炸弹:SWE Atlas。在这套由资深工程师手写的284道考题里,前沿

  新智元报道  【新智元导读】AI写代码已从补丁阶段进入全流程工程评估,SWE Atlas 首次系统评测代码理解、测试编写与重构等核心能力。结果显示,尽管GPT-5.4等模型能完成基础功能,但在代码健康、边界覆盖和跨文件协调上仍有明显不足。当全世界都在用SWE-Bench类基准...
2026-06-17 阅读全文 »