|
1.理解大语言模型.md
|
Update 1.理解大语言模型.md
|
2024-11-25 20:32:53 +08:00 |
|
2.处理文本数据.md
|
Merge pull request #6 from dblate/patch-4
|
2025-03-16 16:37:09 +08:00 |
|
3.实现注意力机制.md
|
add seventh chapter
|
2024-11-18 16:08:18 +08:00 |
|
4.从零开始实现一个用于文本生成的 GPT 模型.md
|
Update 4.从零开始实现一个用于文本生成的 GPT 模型.md
|
2025-04-07 19:57:59 +08:00 |
|
5.在无标记数据集上进行预训练.md
|
Update 5.在无标记数据集上进行预训练.md
|
2025-05-09 19:59:55 +08:00 |
|
6.用于分类任务的微调.md
|
add seventh chapter
|
2024-11-18 16:08:18 +08:00 |
|
7.指令遵循微调.md
|
add seventh chapter
|
2024-11-18 16:14:06 +08:00 |
|
附录A.PyTorch简介.md
|
Update 附录A.PyTorch简介.md
|
2025-04-28 14:42:35 +08:00 |
|
附录B.参考文献和扩展阅读.md
|
Add appendixB
|
2025-04-02 09:33:02 +08:00 |
|
附录C.习题解答.md
|
Add appendixC
|
2025-04-01 20:46:59 +08:00 |
|
附录D.给训练循环添加高级技巧.md
|
Add appendixD
|
2025-04-01 23:29:01 +08:00 |
|
附录E.使用LoRA的参数高效微调.md
|
Add appendixE
|
2025-04-02 17:21:52 +08:00 |