Codex 改代码老跑不通?把测试和 AGENTS.md 补上
Codex 改完代码跑不通,通常不是“模型完全不会写”,而是项目没有把运行方式、测试命令和约束说清楚。最先该补的不是更长的提示词,而是可复现的任务描述、稳定的测试命令,以及仓库里的 AGENTS.md 项目说明。
先让问题能被复现
给 Codex 的任务不要只写“修复登录问题”或“优化页面”。更好的写法是:哪个页面、什么输入、期望结果、现在的错误、如何验证。比如“运行 npm test -- login 应通过,当前失败用例是密码错误提示没有出现”。当验证标准明确时,它会更像在解决 bug,而不是猜产品意图。
AGENTS.md 写什么最有用
OpenAI 提供了 AGENTS.md 指南,核心价值是把项目里的长期规则沉淀下来。这个文件不需要写成大作文,写清这些就够用:安装命令、常用测试命令、代码风格、目录边界、不要改哪些文件、提交前必须跑什么检查。越具体越好,少写“保持高质量”这种无法执行的话。
测试命令要分层,不要只给全量构建
如果每次都让 Codex 跑完整构建,它很可能因为耗时、环境缺依赖或日志太长而判断失准。可以在 AGENTS.md 里分三层:快速单测、相关模块测试、最终构建检查。小修先跑快速命令,涉及共享逻辑再跑更大的检查。这样不仅节省时间,也能让它更快定位是哪一步出错。
仍然跑不通时怎么追问
不要直接让它“再改一次”。先要求它列出失败命令、错误摘要、怀疑原因和下一步最小改动。如果它改了很多文件但没有解释验证过程,就让它收窄范围,只保留与失败用例直接相关的改动。对复杂项目来说,Codex 的输出质量往往取决于你给它的项目地形图,而 AGENTS.md 和测试命令就是这张地图。