TL;DR 链接到标题

  • 请将大语言模型(LLM)视为「统计幽灵」,而非好奇的动物,以实证方式加以运用
  • 构建面向智能体(Agent)的原生基础设施(完善的文档、API、日志、传感器),而非仅聚焦UI
  • 你可以外包「思考」,但不能外包「理解」。人类的品味与判断力依然不可替代
  • 未来的面试与招聘将重点考察智能体原生技能:构建、部署、加固系统,并防御其他智能体的攻击

软件 3.0 已到来 链接到标题

卡帕西重新梳理了编程的演进历程:

  • 软件 1.0:人类编写明确代码
  • 软件 2.0:人类策划数据,模型学习权重
  • 软件 3.0:人类通过提示词、上下文、工具与示例进行编程。上下文窗口即新时代的「程序」

在此新范式下,你无需再逐行编写代码,而是将宏观任务委派给智能体:「实现这个功能」「重构这个模块」「搭建此服务并配置测试」。大语言模型成为能读取你意图并执行的自适应解释器。

典型案例 链接到标题

MenuGen:拍摄餐厅菜单照片。在传统开发模式中,你需要分别构建 OCR、后端、图像生成、前端、部署等。而在软件 3.0 时代,通常只需向多模态模型发送一条提示词,即可直接将照片转换为目标输出。传统软件栈的许多环节就此消失。

自适应系统:取代脆弱的 Shell 脚本,智能体可动态调试环境,并实时调整执行指令。

Vibe Coding vs Agentic Engineering 链接到标题

  • Vibe Coding(直觉式编码):降低入门门槛 — 任何人只需用语言描述想法即可构建应用
  • Agentic Engineering(智能体工程):提升能力上限 — 专业人士必须掌握指挥「会犯错」的智能体,同时确保正确性、安全性、审美判断与系统理解力

核心技能正从「写代码」转向「编排协作」:撰写清晰规格、构建评估体系、设置安全护栏、审查输出结果,并精准识别模型何时在「一本正经地胡说八道」。

「锯齿状智能」与可验证性 链接到标题

大语言模型在结果易于验证的领域表现出色(如能通过测试的代码、有明确答案的数学题、有分数机制的游戏),而在验证困难的领域仍显薄弱。这种「锯齿状」的能力分布,解释了为何编程能力提升迅猛,而其他领域进展相对滞后。

创业者应聚焦同时满足以下三条件的高价值领域:① 结果可验证 ② 经济价值高 ③ 当前训练数据仍不足

写在最后 链接到标题

代码生成与模板化开发正变得触手可及。当下真正稀缺的资源是:深度理解力、系统编排能力、安全思维,以及审美判断力。