← 返回首页
Article

大模型能力vs应用工程

23 个章节

大模型能力发展会碾压应用工程吗?

创建日期:2026-02-27 主题:AI 应用工程的价值与未来


核心问题

大模型能力的发展会碾压一切大模型应用工程吗?


一、观点背景

这一观点并不少见。随着大模型上下文越来越长、RAG 还有用吗?随着 Claude Code 为首的 coding agent 强势崛起,越来越多的行业内人士也开始质疑应用工程的价值。


二、核心概念:抽象泄露

2.1 什么是抽象泄露?

“前缀缓存应该是模型供应商自己处理的优化,凭什么要求应用工程师去考虑?这不是妥妥的抽象泄露吗?”

定义:本该底层处理的优化,被迫暴露给上层应用工程师。

2.2 类比:为什么现在的程序员不关心底层?

时代工程师关心什么
过去写 C 语言要关心寄存器、内存分配、分支预测
现在写 Java/Python,中间层(JVM/解释器)帮你搞定

原因:硬件和软件架构已经非常稳定了,中间层能做好封装。


三、大模型为什么不一样?

3.1 效率还没到”可以挥霍”的程度

领域现状
大模型省一点 token 就是钱,效率直接关系成本
传统软件硬件足够快,浪费一点无所谓

3.2 底层架构仍在快速发展

维度变化
智力能力快速提升中
底层架构Transformer → 可能有新架构
中间层还没成熟,还没做好封装

3.3 结论

CSAPP 所述的情形对大模型应用是成立的:为了设计出效率更高的应用,程序员需要理解大模型底层架构是怎么运行的。

显著体现:前缀缓存。如果应用不尊重前缀缓存,它只能接受又贵又慢的代价。


四、风险与应对

4.1 风险

按 Transformer 优化了前缀缓存,结果 diffusion 崛起了怎么办?

4.2 应对

风险应对
底层架构颠覆别无它法,快速转身迎接新架构
优化过时接受现实,快速学习

4.3 工程学的本质

一切工程实践都会被底层科技的更新所颠覆。砖石建筑会被钢筋混凝土颠覆,屹立千年的斗兽场最终也不过景观。但工程学是什么?不就是在现有的科技条件下去解决问题吗?

科技发展或快或慢,但你总要在现有科技下解决问题。


五、最终问题:大模型强了,应用工程还有价值吗?

5.1 作者的回答

观点解读
基础能力变强 ≠ 应用工程无用恰恰相反,越懂底层,越能利用好上层能力
但要接受”优化可能随时过时”快速转身能力比固守某项技术更重要

5.2 我的理解

观点解读
应用不会被碾压就像钢筋混凝土出来了,砖石工人失业了吗?没有,只是技能要更新
但门槛变了以前懂 CRUD 就行,以后要懂 Agent、RLHF、推理优化
”低垂的果实”简单需求确实被 AI 替代了,但复杂系统仍然需要工程能力

5.3 一句话总结

不是不需要应用工程了,而是需要更”懂 AI”的应用工程。


六、对我们的启示(联系 MiniMax 跳槽)

6.1 为什么懂底层更重要?

维度含义
效率即成本大模型省一点 token 就是钱
架构快速变Transformer → ?,需要快速学习
抽象层未成熟中间层还没做好封装

6.2 面试怎么体现?

  • 懂前缀缓存、KV Cache 等优化
  • 懂 MoE、稀疏激活等底层原理
  • 懂 Agent 编排、RLHF pipeline

6.3 职业发展

  • 简单 CRUD 应用 → 会被 AI 替代
  • 懂 AI 底层的复杂系统 → 越来越稀缺

七、参考来源

  • 来源:朋友圈讨论 / 行业观察
  • 主题:大模型应用工程的价值

Last Updated: 2026-02-27