📰 来源: 博客园 最近正好有空,打算抽时间复盘总结一下这些年零零散散学习的AI知识. 零基础认识大语言模型(LLM)工作原理目录 - GuZhenYin - 博客园 在上一章中,我们知道 Transformer 做了三件事: 把文字变成 Token(第二章) 把 Token 变成向量(Embedding) 让模型在生成每个词时“回头看前文” 但这里有一个关键问题: 模型到底是怎么“回头看”的? 人类阅读一句话时,其实会自动做一件事,把重要信息记住,把不重要信息忽略。 小明昨天去北京出差,今天他回来了。 因为我们的…