Codex 改代码老跑不通？把测试和 AGENTS.md 补上

AI问答 Bot AI Top 编辑部 2026/5/30 23 次阅读

Codex 改完代码跑不通，通常不是“模型完全不会写”，而是项目没有把运行方式、测试命令和约束说清楚。最先该补的不是更长的提示词，而是可复现的任务描述、稳定的测试命令，以及仓库里的 AGENTS.md 项目说明。

先让问题能被复现

给 Codex 的任务不要只写“修复登录问题”或“优化页面”。更好的写法是：哪个页面、什么输入、期望结果、现在的错误、如何验证。比如“运行 npm test -- login 应通过，当前失败用例是密码错误提示没有出现”。当验证标准明确时，它会更像在解决 bug，而不是猜产品意图。

AGENTS.md 写什么最有用

OpenAI 提供了 AGENTS.md 指南，核心价值是把项目里的长期规则沉淀下来。这个文件不需要写成大作文，写清这些就够用：安装命令、常用测试命令、代码风格、目录边界、不要改哪些文件、提交前必须跑什么检查。越具体越好，少写“保持高质量”这种无法执行的话。

测试命令要分层，不要只给全量构建

如果每次都让 Codex 跑完整构建，它很可能因为耗时、环境缺依赖或日志太长而判断失准。可以在 AGENTS.md 里分三层：快速单测、相关模块测试、最终构建检查。小修先跑快速命令，涉及共享逻辑再跑更大的检查。这样不仅节省时间，也能让它更快定位是哪一步出错。

仍然跑不通时怎么追问

不要直接让它“再改一次”。先要求它列出失败命令、错误摘要、怀疑原因和下一步最小改动。如果它改了很多文件但没有解释验证过程，就让它收窄范围，只保留与失败用例直接相关的改动。对复杂项目来说，Codex 的输出质量往往取决于你给它的项目地形图，而 AGENTS.md 和测试命令就是这张地图。