求导 作者:马育民 • 2026-01-10 10:43 • 阅读:10004 需要掌握:[导数](https://www.malaoshi.top/show_1GW2Z9BmgHme.html "导数") # 介绍 求导就是在问一个问题:当改变输入时,输出会怎么变? ### 更形象的解释 想象在开车,车速是: ``` 速度 = 距离 / 时间 ``` 问自己:**“如果我多踩一点点油门,车速会增加多少?”** 这就是求导。 - 油门 = 输入 - 车速 = 输出 - 求导 = 输出对输入的“敏感程度” # 数学上的含义 对于函数 `y = f(x)` 求导 `dy/dx` 的意思是: **x 变化一点点,y 会变化多少?** 比如: ``` y = 2x ``` `x` 增加 `1`,`y` 增加 `2` `x` 增加 `0.1`,`y` 增加 `0.2` 所以导数是 `2`。 意思是:**y 对 x 的变化非常敏感,是 x 的 2 倍。** # 例子 ``` y = x² ``` 当 `x = 3` 时: 导数是 `6`。 意思是: **在 x=3 这个位置,如果你把 x 稍微增加一点,y 会增加大约 6 倍那么多。** 比如 `x` 从 `3 → 3.01` `y` 会从 `9 → 9.06`(差不多增加 0.06) # 求导的本质 **求导就是在测量“变化率”,也就是输入对输出的影响程度。** - 导数大 → 影响大 - 导数小 → 影响小 - 导数为正 → 输入变大,输出变大 - 导数为负 → 输入变大,输出变小 --- # 为什么深度学习要关心这个? 因为训练模型就是在调整参数,让损失变小。 求导告诉我们: **参数改变一点点,损失会怎么变?** - 导数为正 → 参数变大,损失变大 → 应该减小参数 - 导数为负 → 参数变大,损失变小 → 应该增大参数 - 导数绝对值大 → 影响大 → 步子要大一点 - 导数绝对值小 → 影响小 → 步子要小一点 这就是梯度下降的全部逻辑。 --- # 总结 1. 求导 = 求变化率 2. 变化率 = 输入对输出的影响程度 3. 深度学习求导 = 找到让损失变小的方向 原文出处:http://malaoshi.top/show_1GW2Z9DSZRso.html