默认计划
0人加入学习
(0人评价)
摩尔线程 GPU 大模型推理服务部署从入门到精通
价格 免费
音频听课 手机端支持一键听课 (试一试)
该课程属于 大模型推理服务部署学习班
请加入后再学习
课程介绍

一、课程概况

1、课程总课时

本门课程总课时为2课时,其中理论讲解课时1课时,实操课时1课时。

2、课程性质

本门课程为理实一体化课程。

3、课程前导后续知识

无必须前置课程,但建议有一定 MUSA 知识基础,基础的机器学习理解, Python 编程基础,云服务部署知识基础比如 RESTful, docker, curl 等,并放置在 Musify 大模型训练之后。

二、课程目标

学习者能对大模型推理服务有一定了解,包括 Transformer 架构基础、常见术语、常见优化的手段, Benchmark 标准以及摩尔线程关于推理加速方面的服务( MTT )。

三、学习内容

初识大模型推理服务,学习推理服务架构,流程,常见优化手段,并引入摩尔自己的大模型推理服务 vLLM-MTT ;使用 vLLM-MTT 部署大模型推理服务 server ,并现场编写简单的在线/离线的 chat 应用。

四、可提供课程资源

本门课程提供2个学习视频、1个实训单元操作手册。

五、其他补充说明

本课程需要 S4000 机房环境。

授课教师

摩尔学院超级管理员

课程特色

PPT(2)