
karpathy/nanoGPT:快速训练和微调中等大小的GPT模型
2024-07-19 10:05
项目简介: nanoGPT是一个开源项目,旨在提供一种简单快速的方法来训练和微调中等大小的GPT模型。该项目是minGPT的重写版本,侧重于提供高效的训练性能和易于理解的代码基础。项目仍在积极开发中,已实现使用单个GPU节点在几天内复现GPT-2模型。 用户评价: 该项目在GitHub上的活动表明,