大模型能力发展会碾压应用工程吗?
创建日期:2026-02-27 主题:AI 应用工程的价值与未来
核心问题
大模型能力的发展会碾压一切大模型应用工程吗?
一、观点背景
这一观点并不少见。随着大模型上下文越来越长、RAG 还有用吗?随着 Claude Code 为首的 coding agent 强势崛起,越来越多的行业内人士也开始质疑应用工程的价值。
二、核心概念:抽象泄露
2.1 什么是抽象泄露?
“前缀缓存应该是模型供应商自己处理的优化,凭什么要求应用工程师去考虑?这不是妥妥的抽象泄露吗?”
定义:本该底层处理的优化,被迫暴露给上层应用工程师。
2.2 类比:为什么现在的程序员不关心底层?
| 时代 | 工程师关心什么 |
|---|---|
| 过去 | 写 C 语言要关心寄存器、内存分配、分支预测 |
| 现在 | 写 Java/Python,中间层(JVM/解释器)帮你搞定 |
原因:硬件和软件架构已经非常稳定了,中间层能做好封装。
三、大模型为什么不一样?
3.1 效率还没到”可以挥霍”的程度
| 领域 | 现状 |
|---|---|
| 大模型 | 省一点 token 就是钱,效率直接关系成本 |
| 传统软件 | 硬件足够快,浪费一点无所谓 |
3.2 底层架构仍在快速发展
| 维度 | 变化 |
|---|---|
| 智力能力 | 快速提升中 |
| 底层架构 | Transformer → 可能有新架构 |
| 中间层 | 还没成熟,还没做好封装 |
3.3 结论
CSAPP 所述的情形对大模型应用是成立的:为了设计出效率更高的应用,程序员需要理解大模型底层架构是怎么运行的。
显著体现:前缀缓存。如果应用不尊重前缀缓存,它只能接受又贵又慢的代价。
四、风险与应对
4.1 风险
按 Transformer 优化了前缀缓存,结果 diffusion 崛起了怎么办?
4.2 应对
| 风险 | 应对 |
|---|---|
| 底层架构颠覆 | 别无它法,快速转身迎接新架构 |
| 优化过时 | 接受现实,快速学习 |
4.3 工程学的本质
一切工程实践都会被底层科技的更新所颠覆。砖石建筑会被钢筋混凝土颠覆,屹立千年的斗兽场最终也不过景观。但工程学是什么?不就是在现有的科技条件下去解决问题吗?
科技发展或快或慢,但你总要在现有科技下解决问题。
五、最终问题:大模型强了,应用工程还有价值吗?
5.1 作者的回答
| 观点 | 解读 |
|---|---|
| 基础能力变强 ≠ 应用工程无用 | 恰恰相反,越懂底层,越能利用好上层能力 |
| 但要接受”优化可能随时过时” | 快速转身能力比固守某项技术更重要 |
5.2 我的理解
| 观点 | 解读 |
|---|---|
| 应用不会被碾压 | 就像钢筋混凝土出来了,砖石工人失业了吗?没有,只是技能要更新 |
| 但门槛变了 | 以前懂 CRUD 就行,以后要懂 Agent、RLHF、推理优化 |
| ”低垂的果实” | 简单需求确实被 AI 替代了,但复杂系统仍然需要工程能力 |
5.3 一句话总结
不是不需要应用工程了,而是需要更”懂 AI”的应用工程。
六、对我们的启示(联系 MiniMax 跳槽)
6.1 为什么懂底层更重要?
| 维度 | 含义 |
|---|---|
| 效率即成本 | 大模型省一点 token 就是钱 |
| 架构快速变 | Transformer → ?,需要快速学习 |
| 抽象层未成熟 | 中间层还没做好封装 |
6.2 面试怎么体现?
- 懂前缀缓存、KV Cache 等优化
- 懂 MoE、稀疏激活等底层原理
- 懂 Agent 编排、RLHF pipeline
6.3 职业发展
- 简单 CRUD 应用 → 会被 AI 替代
- 懂 AI 底层的复杂系统 → 越来越稀缺
七、参考来源
- 来源:朋友圈讨论 / 行业观察
- 主题:大模型应用工程的价值
Last Updated: 2026-02-27