职工技能大赛
职工技能大赛

Deepseek大模型全参数微调训练实践

发布时间:2025-07-23

本课程介绍了深度思考推理模型和指令微调技术方案,并结合代码实践讲解 DeepSeek-V3/R1 满血版 671B 模型全参数微调的具体训练流程,包括环境配置、数据准备、启动训练、模型权重转换、模型推理部署等完整环节。

课程目录:

1.深度思考推理模型、DeepSeek模型、指令微调技术方案介绍;

2.DeepSeek满血版模型全参数微调与推理部署全流程实践;

3.开源项目与内容总结。


附件下载: