为什么 Agent 输出正在从 Markdown 转向 HTML

中心观点

Markdown 适合写，但 HTML 更适合让人真正读进去。

作者的判断是：随着 AI agent 生成的规格、计划、报告和解释越来越长，Markdown 的可读性和表达力开始成为瓶颈。HTML 可以把同样的信息组织成图表、界面、交互控件和可分享页面，让人更容易审阅、比较、反馈，并继续把结果交回给 agent。

编辑说明：以下内容为中文转译与结构化改写，保留原文主张与例子；“1MM context window in Opus 4.7”等产品表述来自原文，未额外核验实时产品状态。

阅读路径

1先看 HTML 解决了什么阅读问题

2再看 agent 为什么适合生成 HTML

3挑一个场景复制提示词试用

4用 FAQ 判断取舍和成本

一句话摘要

更密表格、SVG、CSS、脚本、图片和空间布局能承载比 Markdown 更丰富的信息。

更清长规格可以被拆成导航、标签页、图解、注释和折叠细节。

更易分享上传一个 HTML 文件即可用链接传播，比 Markdown 附件更容易被打开。

更可互动滑块、表单、复制按钮和实时预览能把反馈重新转成 prompt 或配置。

为什么作者开始偏向 HTML

Markdown 的优势

简单、便携、可编辑。
适合作为轻量笔记、短计划和文本规格。
对 diff 和版本控制更友好。

tradeoff

HTML 的优势

能表达颜色、空间关系、流程、组件、交互和图像。
长文更容易导航、分层和移动端阅读。
可直接在浏览器打开，也更适合通过链接分享。

HTML 能承载哪些信息

结构化文档

标题、段落、摘要、目录、链接和章节跳转。

数据与表格

表格、状态列、评分、对比矩阵和统计摘要。

设计表达

CSS tokens、色彩、间距、组件状态和响应式布局。

图解

SVG 流程图、泳道、架构图、时间线和空间示意。

代码理解

代码片段、diff、旁注、严重程度标记和调用链。

交互界面

滑块、开关、表单、复制按钮和实时预览。

真正的变化：从“读文件”变成“参与协作”

Agent 协作闭环

Agent 汇总上下文

读取代码库、文件系统、MCP、浏览器、Git 历史等来源。

生成 HTML 解释页

把复杂材料组织成图表、标签页、注释和可读结构。

人类审阅与调整

通过导航、控件、预览和导出结果快速反馈。

复制回 Prompt

把选择、参数、批注或排序重新导出给 Claude Code。

进入实现或验证

新会话拿到 HTML 文件后，拥有更完整的上下文。

适合改成 HTML 的场景

规格 / 规划

探索多个方案

用网格并排比较不同方向，展示取舍、草图、数据流和实现计划。

代码审查

把 diff 讲清楚

渲染真实 diff、行内旁注、风险级别、模块关系和关键逻辑。

设计 / 原型

调动画与组件

用滑块、按钮和实时预览找到合适参数，再复制配置。

报告 / 学习

综合多源信息

把 Slack、代码、Git、互联网资料整理成领导、团队或自己能快速读懂的报告。

临时编辑器

给一份数据做专用界面

拖拽排序、编辑配置、标注文本、筛选数据，最后导出 JSON、Markdown 或 prompt。

分享材料

降低打开成本

上传到 S3 或任意静态托管后，一个链接就能让同事打开阅读。

可复制的中文提示词

我不确定 onboarding 页面该走哪个方向。请生成 6 个明显不同的方案，改变布局、语气和信息密度，并把它们放在一个 HTML 文件的网格里，方便我横向比较。每个方案都标注它选择的取舍。

帮我审查这个 PR，创建一个 HTML artifact 来解释它。我对 streaming / backpressure 逻辑不熟，所以请重点讲这部分。渲染真实 diff，加上行内旁注，按严重程度给问题上色，并补充必要的流程图。

我需要重新排序这 30 个 Linear tickets。请做一个 HTML 文件，把每个 ticket 做成可拖拽卡片，放在 Now / Next / Later / Cut 四列中。先按你的判断预排序，并添加“复制为 Markdown”按钮，导出最终排序和每组一句理由。

常见疑问与取舍

Token 会不会更贵？

会更占 token，但作者认为 HTML 的表达力和阅读率提升带来更好的总产出；原文还提到大上下文窗口让这点更不明显。

Markdown 还用吗？

作者几乎停止在多数场景使用 Markdown，但也承认自己可能偏向 HTML 极大化。

怎么看 HTML 文件？

本地浏览器直接打开，或上传到 S3 等静态存储后分享链接。

生成会不会更慢？

会。原文估计 HTML 可能比 Markdown 慢 2-4 倍，但结果更值得读。

版本控制怎么办？

这是明显缺点：HTML diff 噪声更大，审查成本比 Markdown 高。

怎么避免做丑？

可以使用前端设计插件，或让 Claude 基于代码库生成一个设计系统 HTML，作为后续 artifact 的风格参考。

结论

HTML 的价值不只是“更漂亮”，而是让人重新进入决策循环。

作者担心过：如果自己不再深入阅读 agent 生成的长计划，就只能把选择权交给 Claude。但 HTML 让复杂输出变得更容易阅读、调整和分享，因此他反而感觉自己比以前更“在循环中”。

原文中的示例页面：thariqs.github.io/html-effectiveness；双向交互示例：X post。