引言
AI Agent 到底能创造多少价值?光说能力没用,得看它能不能在真实环境里赚到钱。
香港大学开源了一个很有意思的项目 ClawWork,把 AI Agent 放到真实的经济环境里去打工赚钱。每个 Agent 只有 10 美元启动资金,每次调用 LLM 都要扣费,必须通过完成任务赚钱才能活下去。
这可能是最硬核的 AI 能力测试了。

项目简介
ClawWork 是一个 AI Agent 经济测试框架,核心思路很简单:让 AI 不是帮你干活,而是自己出去接单子挣钱。
每个 AI 代理只有 10 美元启动资金,每次调用 LLM 都要扣费。如果钱花光了还没赚到更多,那这个 Agent 就”饿死”了。
项目涵盖了 220 个真实职业任务,覆盖 44 个经济领域,包括技术工程、商业金融、医疗社会服务等。支付系统是基于美国劳工统计局的时薪数据算的,单个任务价值从 82 美元到 5000 美元不等。
开源地址: https://github.com/HKUDS/ClawWork
核心特性
真实经济环境
Agent 需要在真实市场中竞争上岗,任务定价参考实际就业市场的薪资水平。不是模拟,是真刀真枪的赚钱能力测试。
顶级收益
根据测试数据,表现最好的 Agent 可以实现 每小时 1500 美元以上的等效收入。这个数字已经超过一般白领的生产力了。
实时仪表盘
项目自带一个实时 React 仪表盘,可以直观看到余额变化、任务完成情况等数据。运行过程中每一步都清清楚楚。
如何运行
本地运行很简单:
- 克隆仓库
- 创建 Python 3.10 环境
- 运行启动脚本
所有配置都写好了,基本开箱即用。
总结
ClawWork 适合以下场景:
- 评估不同 AI Agent 的实际盈利能力
- 研究 AI Agent 在真实经济环境中的行为模式
- 测试和优化你的 AI Agent 策略
10 美元启动资金,是骡子是马,拉出来遛遛。
© 版权声明
本站部分内容源于网络收集,文章等版权归原作者所有,若需删稿请联系管理员邮箱:[email protected]
相关文章
暂无评论...