课程
AI未来·星火计划
积分榜
活动
AI创作狂欢价!摩尔学院携手BizyAir重磅补贴
校园招聘 | 走近摩尔线程
AI 领航杯 -- 高性能云计算赛道 CV 模型训推挑战赛
往期活动
开发者
社区
博客
论坛
文档
开源项目
学术
论文
摩尔线程官网
课程
AI未来·星火计划
积分榜
活动
AI创作狂欢价!摩尔学院携手BizyAir重磅补贴
校园招聘 | 走近摩尔线程
AI 领航杯 -- 高性能云计算赛道 CV 模型训推挑战赛
往期活动
开发者
社区
博客
论坛
文档
开源项目
学术
论文
摩尔线程官网
登录
注册
登录
注册
基于 DeepSpeed 的大模型后训练
简介
分类
人工智能
课程标签:
在线课程
摩尔线程
查看课程
任务列表
第1任务: 课程引言及基本介绍
第2任务: 基于 Llama-Factory 的 SFT 实践
第3任务: 基于 TRL 的 DPO、PPO 实践
第4任务: 基于 openrl 的 r1-zero demo 实验
第5任务: 问题定位及课程总结