从零构建大模型 1.理解大语言模型 2.处理文本数据 3.实现注意力机制 4.从零开始实现一个用于文本生成的 GPT 模型 5.在无标记数据集上进行预训练 6.用于分类任务的微调 7.指令遵循微调 附录 附录A. PyTorch简介 附录B. 参考文献和扩展阅读 附录C. 习题解答 附录D. 给训练循环添加高级技巧 附录E. 使用LoRA的参数高效微调