LangChain教程：输出解析器-马育民老师

# 介绍

输出解析器的本质是：**把大模型“自由格式的输出” 转换成 “程序可直接使用的结构化格式”**，是连接“自然语言输出”和“工程化代码逻辑”的桥梁。

# 作用

### 1. 统一输出类型，避免重复操作

大模型（如 ChatOpenAI）默认返回的是 `AIMessage` 这类结构化对象（包含 `role`/`content`/`metadata` 等字段），而非纯字符串。

- 没有解析器：你需要每次手动写 `response.content` 才能拿到文本，代码冗余且容易忘；
- 有解析器（如 `StrOutputParser`）：直接返回纯字符串，无需额外处理，且所有场景输出类型统一（都是 `str`）。

### 2. 将“非结构化输出”转为“结构化数据”
这是输出解析器最关键的作用，解决了大模型输出“不可控、不可用”的核心问题：

- **无解析器**：模型可能返回“亲，3+5等于8哦～”这种自然语言，你无法直接提取“8”这个数值用于后续计算；
- **有解析器（如 `JsonOutputParser`/`PydanticOutputParser`）**：可以强制模型输出 `{"question":"3+5等于多少？","answer":8}`，程序能直接通过 `result["answer"]` 获取数值，用于后续逻辑（如计算、存储、接口返回）。

### 3. 工程化作用：校验+容错，保证输出可用

生产环境中，模型输出可能“跑偏”（比如要求返回JSON却返回自然语言），解析器能：

- **格式校验**：如 `PydanticOutputParser` 会检查输出是否符合预设的字段类型（比如 `answer` 必须是整数），不符合则报错；
- **自动容错**：部分解析器（如 `RegexParser`）能从混乱的输出中精准提取目标内容（比如从“结果大概是8左右哦”中提取数字8）；
- **标准化**：统一不同模型的输出格式（比如不同LLM返回的列表格式不同，解析器可统一转为 `list` 类型）。

### 4. 场景化作用：适配特定开发需求

不同解析器针对不同场景解决问题：

- 流式输出场景：`AsyncStrOutputParser` 能逐段解析模型的流式返回，实时输出结果；
- 列表需求场景：`CommaSeparatedListOutputParser` 能把“苹果,香蕉,橙子”转为列表，直接用于循环遍历；
- 精准提取场景：`RegexParser` 能从回答中提取手机号、日期、金额等关键信息，无需手动写正则处理。

# 分类

LangChain 的输出解析器并非零散的工具，而是围绕“输出格式需求”划分的核心大类，整体可分为 6 大核心类型，衍生出十几种具体实现，以下是按使用频率排序的分类：

### 1. 基础文本类解析器（最常用）

核心作用：处理纯文本输出，是日常开发中使用频率最高的类别。

- **StrOutputParser**：将 `AIMessage` 转为纯字符串（你之前问的核心解析器）；
- **CommaSeparatedListOutputParser**：将模型输出解析为逗号分隔的列表（如把“苹果,香蕉,橙子”转为 `["苹果", "香蕉", "橙子"]`）；
- **RegexParser**：通过正则表达式提取指定格式的文本（如从回答中提取手机号、数字、日期等）。

### 2. 结构化数据类解析器（高频常用）

核心作用：将模型输出转为结构化数据（如字典、JSON、自定义对象），适配工程化场景。

- **JsonOutputParser**：强制模型输出 JSON 格式并解析为 Python 字典；
- **PydanticOutputParser**：基于 Pydantic 模型定义结构化输出（比 JSON 解析更严格，支持字段校验、类型约束）；
- YamlOutputParser：解析 YAML 格式的输出，适合配置类场景。

### 3. 对话/消息类解析器（中高频）

核心作用：处理多轮对话场景的消息格式，适配聊天模型的消息结构。

- ChatOutputParser：将模型输出解析为 `BaseMessage` 类型（如 `AIMessage`/`HumanMessage`）；
- BaseCumulativeTransformOutputParser：累积式解析，适合流式输出场景（逐段拼接解析结果）。

### 4. 列表/枚举类解析器（中常用）

核心作用：将模型输出解析为列表、枚举等结构化集合。

- **ListOutputParser**：将模型输出转为纯列表（无需逗号分隔，自动识别换行/分号等分隔符）；
- EnumOutputParser：强制模型输出符合指定枚举值的结果（如仅允许输出“是/否/不确定”）。

### 5. 流式输出解析器（场景化常用）

核心作用：适配模型的流式输出（逐字返回），实时解析结果。

- StreamingStdOutCallbackHandler：流式输出时实时打印（偏回调，非纯解析器，但常配合使用）；
- AsyncStrOutputParser：异步版本的字符串解析器，适配异步流式调用场景。

### 6. 特殊场景解析器（低频但实用）

核心作用：解决特定业务场景的解析需求。

- NumberedListOutputParser：解析带编号的列表（如“1. 苹果 2. 香蕉”转为列表）；
- MarkdownListOutputParser：解析 Markdown 格式的列表（如 `- 苹果\n- 香蕉` 转为列表）；
- DatetimeOutputParser：解析日期时间格式的输出（如从回答中提取并标准化时间）。

# 选择解析器的原则

1. 纯文本需求 → 优先用 `StrOutputParser`；
2. 结构化数据需求 → 简单场景用 `JsonOutputParser`，生产环境用 `PydanticOutputParser`；
3. 列表类输出 → 简单逗号分隔用 `CommaSeparatedListOutputParser`，复杂格式用 `ListOutputParser`；
4. 精准提取特定内容 → 用 `RegexParser`；
5. 流式输出 → 用异步/累积式解析器（如 `AsyncStrOutputParser`）。

# 总结

1. 输出解析器的作用是：**让大模型的输出从“人能看懂的自然语言”，变成“程序能直接使用的结构化数据”，同时保证输出的格式正确、可用，减少手动处理的冗余代码和出错概率**。

2. **高频常用**：日常开发优先掌握 `StrOutputParser`、`JsonOutputParser`、`PydanticOutputParser`、`CommaSeparatedListOutputParser` 这 4 种，可覆盖绝大多数场景；

3. **选择逻辑**：根据输出格式需求（纯文本/结构化/列表）选择对应解析器，生产环境优先用带校验的解析器（如 Pydantic）。

简单来说，输出解析器的核心价值是“把模型的自由输出转为可工程化使用的格式”，常用的就集中在文本、JSON/结构化、列表这三类，无需记忆所有类型，按需选择即可。

原文出处：http://malaoshi.top/show_1GW2qkaxT4OX.html