本课程介绍了大语言模型的推理技术。首先介绍了大语言模型推理的背景与思维链技术的发展,进一步介绍了提示词工程、监督微调和强化学习微调的推理技术,接着分享了监督强化微调和自主思考的两个强化学习实践案例,最后进行了总结和展望,随着大模型推理能力的增强,智能体技术将迎来蓬勃发展。
课程目录:
1. 大模型推理背景;
2. 大模型推理技术 ;
3. 强化学习实践案例;
4. 总结与展望。
附件下载:
本课程介绍了大语言模型的推理技术。首先介绍了大语言模型推理的背景与思维链技术的发展,进一步介绍了提示词工程、监督微调和强化学习微调的推理技术,接着分享了监督强化微调和自主思考的两个强化学习实践案例,最后进行了总结和展望,随着大模型推理能力的增强,智能体技术将迎来蓬勃发展。
课程目录:
1. 大模型推理背景;
2. 大模型推理技术 ;
3. 强化学习实践案例;
4. 总结与展望。
附件下载: