pytorch api文档:nn.functional.cross_entropy()交叉熵损失函数
pytorch api文档:torch.flatten()函数-将张量展平成一维
pytorch api文档:torch.log() 函数-自然对数
pytorch api文档:torch.no_grad()函数-关闭梯度计算
pytorch api文档:nn.Module类的.eval()方法-将模型切换到评估/推理模式
大模型原理:计算文本生成损失(交叉熵损失函数)
大模型原理:修改大模型配置
大模型原理:评估文本生成模型介绍
大模型原理:文本生成过程、优化生成文本
大模型原理:本教程根据《从零构建大模型》编写