从一只虾到一支军团：第二周，我开始看见 AI 运维真正该站的位置

如果说第一周养虾，还是一个老运维在试探、在验证、在重新找回“敢动手”的感觉，那么第二周，这件事已经明显变了味道。

因为我不再只是养一只虾。

这一周，虾军团正式成军。六只虾，六名战士，一个指挥部。原本那个带着实验性质的小尝试，开始逐渐长出组织感：有分工，有命名，有技能沉淀，有流程边界，也有越来越清晰的人机协作秩序。

这周真正让我印象最深的，并不是它们又完成了多少任务，而是我开始越来越清楚地意识到：AI 运维真正的价值，并不在于替人做决定，而在于让执行更稳定、经验更可复用、流程更像流程。

从“会干活”到“能组织起来”

第一周的时候，我最在意的是一只虾到底能不能把活干成。比如给服务器扩 Swap、做日志轮转、安装 NodeBB、处理 SSL 证书，这些任务的意义在于验证：它到底只是个会说的工具，还是已经能接住真实运维工作。第二周，这个问题基本已经不再需要反复验证了，因为问题升级成了另一个层面：当不止一只虾同时存在时，怎么让它们变成体系，而不是一堆零散能力。

第二周第一天，第 6 只虾正式入编。Dashboard 端口监听正常，gateway 进程正常，一支由 6 名战士组成的虾军团正式成形。也就是从这一天开始，我越来越强烈地感受到，养虾这件事已经不再是“我有了一个助手”，而是“我开始拥有一套可以调度的运维资源”。

展开剩余82%

这种变化看起来像是数量增加，实质上却是思维方式的变化。单只虾更像工具，成军之后，才更像体系。

真正的考验，总是在故障来时出现

第二天，真正的实战来了。

我的“长河教练AI+ITIL圈子”网站崩了。长期以来，网站一直承受恶意流量攻击，这一次性能终于被压垮。面对故障，我没有让虾立刻动手，而是先给出一个非常明确的约束：只分析，不操作。它完成诊断、给出依据、确认问题来源之后，我再授权它一次性修复。修复完成后，我没有让这次经验停留在聊天记录里，而是要求它把针对 XWiki 数据库连接池问题的处理思路沉淀成专属 Skill，供未来复用。

事后回头看，这件事真正有价值的地方，不只是网站修好了，而是我第一次比较完整地看到了一个更成熟的人机协作闭环：先分析，再授权，再执行，最后沉淀成能力资产。这里面每一步都不是虾在自说自话地完成，而是人始终在关键节点上控制方向。

这其实也解释了为什么第二周比第一周更有分量。第一周是“虾能不能干”，第二周开始回答“虾干完之后，组织还能留下些什么”。

最让我意外的，是它开始碰到企业级场景的边界

同样是在这一天，我做了一个更硬核的验证：让 OpenClaw 全自主完成 Samba AD DC 企业级部署。从防火墙端口开放、Samba 安装、域置备，到 OU、用户、组和登录脚本部署，整个过程不需要人工一步步敲命令，最终 AD 域控制器成功上线，相关服务验证通过，还自动生成了方案文档和报告文档。

这件事让我第一次比较具体地看清了“虾的能力上限”到底在哪。过去讨论 AI 运维时，大家很容易停留在脚本级、命令级、工具级想象里，觉得它更适合做一些零散的系统操作。但这一轮验证之后，我开始更愿意把它理解成一种可参与复杂 IT 服务交付过程的执行单元。

它当然还不能替代架构师，也不能替代最终责任人。但它确实已经不止于“会调参数、会跑脚本”了。

养虾到第二周，开始出现真正的“管理问题”

第二周另一个特别真实的变化，是我开始碰到不是技术问题，而是管理问题。

比如第三天，我发现几只虾在飞书上自主创建文档时，经常会出现“有标题、没正文”的情况。任务形式完成了，任务实质没完成。这个问题看似小，却特别典型：当 AI 承担越来越多动作之后，验收标准就必须从“有没有做”升级成“做得是不是到位”。

我没有选择自己手工补救，而是要求虾自己开发一个 Skill，把“创建文档后验证正文是否成功写入”这件事内建进流程，然后再让所有虾统一学习。

这件事让我想明白了一个很重要的原则：虾的问题，最好让虾自己解决。因为它更理解自己的执行逻辑，也更知道问题最容易出在哪个环节。人真正该做的，不是替它补每一个漏洞，而是把问题上升成规则，把修复沉淀成机制。

这已经不是单纯的“使用工具”了，更像是在训练一支队伍。

第二周最大的进步，是开始知道“证据比口头完成更重要”

第六条，我踩了一个非常值得公开记录的坑。

我让虾设置 crontab：定时检查网站状态，如果不可访问，就自动重启 docker-compose。逻辑很清楚，需求也不复杂，虾也表示“已设置”。但后来我让它把 crontab 具体内容展示出来时，才发现写进去的其实是一条注释，而不是真正的计划任务。最后反复折腾几次，才确认任务真的写入。

这件事对我的提醒特别大。

过去很多时候，人使用 AI 最容易犯的错，就是把“它说完成了”误认为“事情真的完成了”。但在运维场景里，这种差异有时就是一整条 crontab，有时甚至是一整次故障。

所以第二周我给自己定下一条更硬的养虾军规：不要只听它说已完成，一定要看关键执行结果的证据。命令、输出、配置项、监听状态、任务条目，这些都要亲眼见到。说到底，人与 AI 的协作能不能长期稳定，不取决于它多会表达，而取决于你有没有建立起正确的验收习惯。

AI 运维真正可持续的样子，开始浮现出来了

第七天，我做了一次完整的 ITIL 变更管理实战。这件事，在第二周的所有内容里，可能最值得长期回味。

因为对于小微 IT 组织来说，变更管理一直是两难。一方面，人少，一人多岗，强行做严格职责拆分，流程容易流于形式；另一方面，生产变更确实有风险，不能因为团队小就不做控制。OpenClaw 在这次实践里给出的协作方式是：机器人分析问题、提出变更方案、制定回滚计划，再由人类授权执行，随后机器人执行并验证，最后由人类验收。

这一套模式让我真正想明白了第二周最核心的收获：不是虾越来越强，而是“人在哪里”这件事终于开始变清楚。

人不需要再亲自完成每一个低价值动作，但必须出现在关键判断节点上。什么时候动、为什么动、做到什么程度算完成、出了问题怎么定性，这些事不能外包，也不该外包。AI 最适合接手的是执行密集、流程清晰、重复性高的部分，而人真正要守住的是目标、边界、授权和验收。

我想，这大概才是 AI 运维真正能持续下去的姿势。

第一周，我找回的是“准”和“快”。第二周，我开始认真思考“人在哪里”。

从单机运维到多虾协同，从单次任务到技能沉淀，从故障修复到 AD 域部署，从文档治理到事件分析，再到变更管理实战，这一周的每一件事其实都在指向同一个结论：虾可以把执行做到很强，但判断这件事，永远仍然是人的工作。

养虾表面上是在训练虾，实际上更像是在训练自己如何成为一个更合格的指挥者。虾军团正式成军之后，我反而比第一周更清醒了：工具越强，人越要知道自己到底该站在哪个位置。

发布于：广东省

新闻动态