Scale AI
Scale AI 是一家专注于 AI 数据基础设施和评测的公司,发布了多个知名 AI 评测基准。
与软件工程 AI 相关的工作
- ../projects/swe-atlas.md — AI 编程 Agent 多维度评测基准(496 QnA + 360 Test Writing 任务)
- 运营 Scale Leaderboard: https://labs.scale.com/leaderboard/
相关实体
- ../projects/swe-atlas.md — 旗下开源基准项目
- ../projects/harbor.md — 合作使用的任务运行框架(laude-institute 出品)
- swe-atlas, arize-alyx