📰 来源: 博客园 2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要?它如何从训练老鼠变成训练大模型?这篇文章带你一探究竟。 一、一个老鼠实验引发的革命 1.1 斯金纳箱:强化学习的源头 1930年代,心理学家斯金纳做了一个著名实验: 老鼠偶然按压杠杆 → 食物掉出来(奖励) 多次之后 → 老鼠主动频繁按压杠杆 "按杠杆 = 有吃的!" 这就是强化学习的核心思想:通过尝试动作,根据获得的奖励调整行为。 半个世纪后,这个思想启发了AI研究者: 如果老…