首页
课程
班级
教师
社区
博客
论坛
文档
GitHub
关于我们
首页
课程
班级
教师
社区
博客
论坛
文档
GitHub
关于我们
登录
注册
登录
注册
基于 DeepSpeed 的大模型后训练
简介
分类
人工智能
课程标签:
在线课程
摩尔线程
查看课程
任务列表
第1任务: 课程引言及基本介绍
第2任务: 基于 Llama-Factory 的 SFT 实践
第3任务: 基于 TRL 的 DPO、PPO 实践
第4任务: 基于 openrl 的 r1-zero demo 实验
第5任务: 问题定位及课程总结