引子
2025年底至2026年初,OpenClaw的出现重新将AI带入笔者的视野。在此之前,作为一名"古法程序员",虽然以前也倒腾过GPT、DeepSeek、SD等模型,但可能未深入使用,对AI的刻板印象一直停留在"玩具"层面——炼丹、炼金、"随机"编程、自然语言编程,仿佛与严肃的工程开发相去甚远。
但是随着近期爆发式的AI技术浪潮,对相关内容也做了很多学习和实践。
- AI生态术语爆炸:Vibe Coding、Spec Coding、SDD、Harness Engineering、Agent、Skill、MCP。
- 工具与模型百花齐放:
- Agent工程:Claude Code、OpenClaw、Hermes-Agent、Cursor、Trae
- LLM:Claude、GLM、GPT、Gemini、DeepSeek、Qwen3、Kimi、豆包
- 效率与能力的悖论:AI带来效率跃升的同时,也带来了"能力萎缩"的隐忧,过度依赖会弱化自身工程素养
- 信息过载:大量优质文章、源码解析、实战经验扑面而来
下面笔者会在当前在AI方向上的核心定位、关注方向、能力维度、重点资源以及待深入的问题,作为阶段性的学习地图。
一、核心定位与态度
1. 从"古法程序员"到AI实践者
尤其在AI Coding方面,以前用的比较多的是代码补全,很多时候补全出来的代码挺好的,
并且自己也试着用AI来生成一些新系统代码,发现生成出来的代码质量还真不错,就拿我所在的行业,游戏行业,现在AI在Coding方面已经很强了。
- 起点:2025年底至2026年初,OpenClaw的出现重新将AI带入视野,此前对AI的印象停留在"玩具"层面。
- 转变:通过大量实践发现AI在Coding方面已相当强大,在游戏行业的代码生成上表现也比较突出,Vibe coding、Spec coding和Harness Engineering的实践结果发现在好的范式下使用AI,效率确实提升明显
- 态度:
- 虽然AI大大提升了某些方面工作内容的效率,但保持AI是工具,需求由人产出,工具服务于需求。
- 以目标和解决问题为导向。
- 不盲从、不排斥新的概念,新的工具,新的工作流。
- 类似于通过消息摘要生成更多代码内容。但是用好还是很有必要的,在于如何传达精准的需求。
2. 常见的疑问(wwh)
- 什么是AI?
- AI是怎么理解自然语言含义的,为什么感觉AI这么强?
- AI的原理是什么?
- 为什么要会用AI?
- 现在感觉随便用AI就能生成点出来,很快就能完成以前长篇的代码书写?(效率提升?)
- 在这个信息爆炸的时代,要以何种思维来过滤大部分知识呢?(知识库)
- 怎么用以及如何用好?
- 如何将AI应用到生产级别中?
- 实践经验和技巧有哪些?
3. 有趣的比喻
- 在这个AI游戏世界里:一个人的综合能力 =(基础永久属性 + AI固定属性)* (1 + AI百分比属性加成 )
- 人的提升是基础永久属性的增长,而AI固定属性的提升目前来说很快,但就像打游戏一样,无论每个版本装备怎么升级,但永久的基础属性才是根本。
二、当前关注的方向
1. AI基础原理
在使用AI前,需要对AI的底层原理有一定了解。
https://www.bilibili.com/video/BV1ajZ7BmEDn?spm_id_from=333.788.player.switch&vd_source=1d9912d25f7287c34d8d6206672edae5&p=5
- 无监督学习、监督学习、强化学习等基础概念。
- AI理解自然语言的底层原理探索。(Transformer)
- RAG(检索增强生成)、PAL(程序辅助模型)、React(联网搜索)。
2. AI工具与模型生态
2.1 编程或Agent工具
| 工具 | 特点 | 适用场景 | 优势 | 不足 |
|---|---|---|---|---|
| Claude Code | 规划与执行分离的工作流,Agent Harness工程的代表,终端优先 | 复杂工程重构、CLI工作流、大型代码改造 | 长上下文、代码推理强、自主任务拆解 | 无GUI、上手成本高 |
| OpenClaw | 社区热度高,热门编程Agent框架,多模型兼容 | 自动化任务、模型调度、CI/CD集成 | 扩展性强、工具调用完善、生态活跃 | 配置复杂、工程化成熟度一般 |
| VSCode+插件 | 经典文本IDE+AI插件组合,通用轻量化方案 | 日常全品类开发、轻量编码、通用项目 | 生态完善、自定义高、普及率广 | 无原生Agent,依赖第三方插件 |
| Rider+插件 | UE专属IDE解决方案,深度适配游戏开发 | Unreal Engine、C++游戏项目、蓝图开发 | 调试强大、UE深度适配、游戏工程优化 | 收费订阅、非游戏场景性价比低 |
| Hermes-Agent | 通用热门Agent框架,任务自动化能力强 | 多场景自动化、轻量Agent搭建 | 多模型适配、任务规划灵活、社区火 | 编程专项优化较弱 |
| Cursor | 编程支持度极强,AI原生编辑器,行业标杆 | 复杂项目开发、多文件协作、专业编码 | 代码质量高、Agent成熟、项目理解强 | 国内访问一般、高级功能付费 |
| Trae | 中文支持度优秀,价格实惠,本土化适配 | 国内开发者、中文办公、低成本开发 | 免费额度足、上手简单、中文体验好 | 大型复杂项目处理能力有限 |
2.2 大语言模型(笔者常用排名)
| 模型 | 特点 | 优势场景 | 核心亮点 |
|---|---|---|---|
| Claude | 长上下文、代码能力强、指令遵循稳定 | 代码开发、长文档解析、复杂工程任务 | 超长文本承载、逻辑严谨、编码能力顶尖 |
| GLM | 国产主流模型,持续迭代,综合性能均衡 | 中文办公、文案创作、本土业务场景 | 本土化优化好、迭代快、国产生态完善 |
| GPT | 行业初代标杆,生态完善,综合能力全面 | 全场景通用、复杂逻辑、多模态需求 | 插件生态丰富、通用性强、适配工具多 |
| Gemini Pro 3 | Google出品,多模态能力突出 | 图文/跨模态解析、超长文档处理 | 多模态天花板、谷歌生态联动、超大上下文 |
| DeepSeek | 国产模型,代码专项能力突出,高性价比 | 代码编写、算法开发、本地部署 | 编程能力强、低成本、中文适配优秀 |
| Qwen3 | 阿里国产大模型,全场景均衡迭代 | 日常创作、轻量化应用、多模态场景 | 开源生态完善、更新快、综合表现稳定 |
| 豆包 | 联网检索能力强,轻量化日常助手 | 实时资讯查询、常识问答、资料检索 | 纯免费、中文口语化、实时联网搜索 |
| Kimi 2.5 | 中文支持度好,免费额度大,长文本友好 | 中文文档阅读、长文案撰写、资料汇总 | 免费额度充足、长文本解析、中文理解强 |
2.3 辅助工具
- CC Switcher:管理Skill和MCP的工具。
3. AI编程方法论
3.1 三大方法论对比
| 方法论 | 核心思想 | 当前状态 |
|---|---|---|
| Vibe Coding | 边聊边写,先跑起来再优化的直觉式编程 | 已实践 |
| Spec Coding (SDD) | 先规划后实现,按工程标准逐步构建的结构化编程(SDD : Specification-Driven Development) | 深入学习中 |
| Harness Engineering | 通过规范和约束驾驭AI长程任务 | 关注中 |
3.2 Spec Coding 工作流(OpenSpec为例)
探索(Explore)→ 提案(Propose)→ 规格(Specs)→ 设计(Design)→ 任务(Tasks)→ 实现(Apply)→ 归档(Archive)
研究(Research)→ 规划(Plan)→ 标注迭代(Annotate)→ 待办清单(Todo List)→ 实施(Implement)→ 反馈微调(Feedback & Iterate)
4. AI辅助编程的具体应用场景和实践
4.1、核心应用场景
1. 代码补全
- IDE环境下的单行、多行代码补全
- Vibe Coding场景中,可采用TODO注释补全法,并封装为补全Skill,提升使用效率
2. 代码生成
- Spec Coding模式:先开展需求讨论,再执行编码操作,以Change为单位推进,后续对支持生成策划所需文档,以及BUG、崩溃修复相关日志较为便捷
痛点:上下文过长易导致Token消耗过快
解决方法:可通过Harness Engineering方式开启新对话,或在合适时机手动生成Memory.md文件以开启新对话;同时,也可手动触发上下文压缩,减少Token消耗。
3. 代码理解
- 代码搜索与扫描:采用Agent子代理协作模式,在SubAgent中使用Haiku等轻量化模型执行扫描操作,生成CodeMap、CodeWiki等成果,实现“一次扫描、多次复用”
- 代码Review、代码重构、代码注释生成
4. 聊天与搜索引擎替代
多数模型支持联网搜索功能,可替代部分搜索引擎的使用需求;也可选用豆包等免费工具完成搜索任务。
5. Skill:编写Skill与MCP
可让LLM自主学习Skill与MCP工具,待优化形成统一的Skill模板后,后续新增Skill均可基于该模板输出。初期可引导LLM学习OpenSpec的Skill写法,既可以封装自身编写Skill的专属Skill,市面上也有丰富的参考案例可供借鉴。
6. Skill:新工区创建
每次开启新对话或新工区时,均需向AI补充大量上下文信息。借助该Skill,可快速创建新模板工区,同步完成工程规范、中文设置、日志记录等相关配置。
4.2、相关工具实践
1. OpenClaw安装与实践
相关参考链接:
结合ollama与OpenClaw使用时,直接安装nvm、node、npm环境,即可快速完成OpenClaw的安装部署。其中,ollama可用于部署本地模型(如deepseek、qwen3等小模型),但存在模型质量与运行速度欠佳的问题;同时,ollama可快速启动Claw,提升使用便捷性。此外,已实践完成OpenClaw与QQ、Wechat的接入配置。
2. Claude Code相关参考
相关参考链接:
- https://boristane.com/blog/how-i-use-claude-code/#phase-1-research
- https://github.com/anthropics/claude-code
4.3、补充说明
1. 提示词相关补充
- 小样本提示(Few-shot):通过提供示例,引导AI快速理解需求
- 思维链(Chain of Thought):引导AI开展深度思考,提升输出准确性
注:AI大语言模型的输出效果受训练数据影响,可结合RAG、PAL(程序辅助模型)、React(联网搜索)等方式,进一步提升AI的“聪明度”;多实践、刻意练习优质方法,可更好发挥AI编码价值。
2. Spec Coding方法(理想化工件模式)
- /opsx:onboard :提出需求梗概
- /opsx:explore :细化需求,讨论潜在问题
- /opsx:ff :快速生成提案(proposal)、规格(specs)、设计(design)、任务(tasks);或使用/opsx:continue ,分步推进
- /opsx:apply :生成代码
- 修复编译错误,验证测试效果,写成Skill,进行自动化验证
- /opsx:achive,归档本次Change
3. 编程模式对比
- 古法编程(朴素直接):包含vibe coding、聊天与搜索引擎使用、代码补全
- AICoding(“随机编程”)(需精准传达需求语义):包含vibe coding、spec coding、聊天与搜索引擎使用、代码补全、代码生成、代码Review、代码搜索、代码扫描、代码注释、代码理解
4. AI规范编程(以OpenSpec为例)
- 创建目录:mkdir .claude
- 在该目录下执行OpenSpec init初始化操作
- 拷贝项目规范文件,或通过Windows创建符号链接实现共用
核心流程:探索(Explore)→ 提案(Propose)→ 规格(Specs)→ 设计(Design)→ 任务(Tasks)→ 实现(Apply)→ 归档(Archive)
5. Skill分类与复用
- 全局Skill:无需额外配置,所有工作区均可通用
- 局部Skill:为每个工作区独有,需在对应工作区单独安装;也可通过软连接方式,实现跨工作区复用
5. Skill与MCP生态
- Agent Skill / Hook:Claude Code的扩展机制。
- MCP(Model Context Protocol):AI与外部工具的交互协议。
- SubAgent:子代理协作模式。
- Host Control MCP Server:构建历程与使用指南已关注。
- unreal-mcp:UE与MCP的对接方案。
6. 游戏行业 + AI
- LevelMaker:用AI Agent搭建UE5关卡生产管线。
- OpenClaw安全能力框架:AI安全相关。
- SDD实践:用Spec对齐需求、突破技术陌生感。
三、待深入的问题
- 在信息爆炸时代,如何高效过滤知识?
- 如何平衡AI提效与自身能力成长的关系?
四、近期关注的新方向
- Hermes-Agent 和 OpenClaw 的新进展。
- AI在长程记忆方面研究
- AI规范编程(SDD / Harness Engineering)在游戏项目中的落地。
- 本地模型部署OpenClaw +(ollama + DeepSeek / Qwen3)的实用性提升。
总结
AI浪潮之下,方法论、工具链、模型生态、Agent协议齐头并进。本文以清单形式锁定了当前阶段的关注面,目的不是"全都学",而是建立一张可持续更新的地图:知道哪些是已实践、哪些在深入、哪些待补齐。后续的每一次选型、每一次踩坑,都将围绕这张地图回写更新。
主动接纳新事物,不要抗拒;但学习不能盲目,要搭建框架、找准目标,想清楚再行动。
核心原则(通过现象看本质)
需要坚定的一些事情是:
- 以目标和解决问题为导向去思考和实践。
- AI是工具,需求是人本身才会产出的,工具是为了服务于需求的。
- 站在前人肩膀上思考和实践。
- 保持学习能力和实践能力,只有不断进步,否则不进则退。
- 摒除急功近利的想法,先有规划再行动,避免盲人摸象,同样需避免过度追求最新概念而不进行脚踏实地的实践。
- 警惕过度依赖AI带来的能力弱化,效率提升不应以自身进步停滞为代价。
提效的弱化自身能力,虽然AI可以在Coding方面大大提高效率,但是太依赖,自身能力还是会弱化或者不进步。
Note:第6条是整个学习过程中最容易被忽视、却最致命的一条。