Large Language Model

AI大模型研发工程师

实训课程(可参与就业推荐服务)

参加AI大模型算法工程师项目实训

我们用AI 赋能,为 200 多个行业客户提供AI 解决方案,并顺利实现了商业化,积累了丰富的经验。AI技术快速发展,尤其是大模型的出现及火爆,导致了就业市场出现了相关人才的短缺,面对此类工作岗位人才的巨大缺口,我们运用自身6年的人工智能项目经验,结合当下不断迭代的最新AI技术,研发出适合当前就业市场需求的AI大模型算法工程师课程,促使越来越多的有志之人投身于人工智能大发展的浪潮中。

学员参与就业推荐服务

✔ 上海、苏州、杭州、北京、深圳等多家AI合作企业
✔ 推荐入职上述企业的人工智能及相关研发岗位工作并提供就业保障
✔ 通过考核的学员获得上海交大教育AI大模型算法工程师培训证书
✔ 学习未达标者,提供免费重修服务

项目优势

专业的实验设备

为学员配套练习,配置大模型训练微调所需要的算力资源,实训基本花巨资购买GPU卡和服务器,让每一位同学都有至少一台训练设备;

直面真实场景实操,全面掌握实战技能

线下学习通过实际项目实操,学员能够直接面对真实场景中的问题,有助于理解理论知识在实际工作中的应用。这种实战经验对于学员的问题解决能力和模型微调技巧至关重要;

紧跟行业趋势

紧跟行业趋势,让学员所学技能不过时,提升其在职场的技术领先优势

行业资深项目经理授课

由资深大模型项目研发专家亲自执导,为您带来成体系的微调技术课程。在这里,您将直接受益于业界权威的专业知识和实战经验,深入掌握前沿的大模型微调策略。

深度体验实操练习,培训动手实战能力

我们的课程特别设计了一系列实操环节,确保学员不仅理论学习,更能亲自动手实践,深刻理解技术的来源与应用原理。通过这样的深度体验,学员将大幅提升技术的实际运用能力,增强自身竞争力。

AI大模型算法工程师的岗位职能

✔ 熟悉各类AI大语言模型和多模态大模型,能私有化部署;
✔ 熟练使用 LangChain等框架,对RAG,Agent有深入理解和思维链设计。;
✔ 负责相关产品的模型训练和服务部署;
✔ 对主流的大模型(GPT、文心一言、百川、chatGLM、通义、LLaMA等)有较丰富的使用经验和prompt微调经验;
✔ 掌握大语言模型SFT/LoRA/RLHF等技术,提升特定任务的大模型能力;
✔ 熟练掌握主流深度学习框架pytorch,LLM训练并行框架Deepspeed等多机多卡方案;
✔ 跟踪大模型领域前沿技术,提出创新思路来推动算法升级和业务发展。

参与AI大模型算法工程师人才培养计划,您将任职以下类型的工作角色

 

岗位名称 工作经验 岗位薪资 岗位职能
AI大模型算法工程师 一年至三年 1.2万-3万 能够应用相关工具和框架进行大模型的微调和优化
大模型算法高级工程师 三年以上 3万-5万 对大模型的训练和部署有深入理解,能够独立完成与大模型相关的各种项目
算法专家 五年以上 50-80万年薪 熟悉常见的机器学习和深度学习算法,具备扎实的算法功底和编程能力
技术总监/CTO 十年以上 百万年薪 管理层,组建技术团队并带领技术团队开展产品研发、测试以及保证项目顺利交付的能力
声明:以上数据截至到2024-06-27,每天搜索查询结果可能存在差异,用户可以直接访问BOSS直聘查询岗位,以当天查询结果为准。
以“AI大模型算法工程师”岗位为例,查询链接:https://www.zhipin.com/web/geek/job?query=AI大模型算法工程师

真实优秀毕业同学的话

适合人群

IT研发工程师

移动端开发,C++/Java有项目研发经验,代码能力强,学习后薪资涨幅较高。

本科及以上高校学生

计算机、人工智能、软件工程、数学、电子信息等相关的专业,本科及硕士人群。

产品经理

项目管理、产品经理、或者细分行业准备做智能化升级的负责人。

想进入AI领域发展的人群

想转行进入AI领域,IT相关职位优先。

实战项目演示

关于上海交大教育集团简介

上海交大教育(集团)有限公司于1999年8月4日设立,注册资本1.5亿元人民币,股东为上海交大产业投资管理(集团)有限公司和上海新南洋昂立教育科技股份有限公司。集团以独立法人经济实体的形式对外发展终身教育事业,传承 “起点高、基础厚、要求严、重实践、求创新”的醇厚传统,秉持“严谨、务实、创新”的质量方针,为打造社会化教育平台,充分发挥自身在教育、人才、技术及信息方面的资源和优势并服务于社会。

合作企业

专职师资团队

丁老师

前沿AI应用架构师与企业级AIGC实战专家。 拥有近20年软件研发与架构经验,曾任甲骨文(Oracle)资深数据架构师、腾讯云技术专家。 他擅长将大语言模型(LLM)技术与企业核心业务(如商业预测、运营分析)相结合,主导开发并交付了多个覆盖快消、医疗等行业的AIGC应用项目。

金老师

软件开发与AI实战专家。 拥有近二十年软件研发与教学经验,精通Python、人工智能(机器学习、大模型)及企业级低代码/RPA技术。 曾主导研发多个大型项目,近年深度参与中国管理学会大数据专业委员会牵头的AI大模型项目落地,实战经验覆盖工业、教育、办公自动化等多个领域。

邹老师

AIGC人工智能与数字化新媒体实战讲师。 拥有15年互联网及6年新媒体从业经验,上海交大教育集团高级讲师。 他精通AIGC应用、智能体开发及新媒体营销,擅长将大模型技术与企业应用场景深度结合。 致力于为企业提供私有化大模型搭建、智能体开发等一站式解决方案,实现降本增效。

王老师

人工智能与大数据运维分析专家,芝加哥伊利诺伊理工学院计算机硕士。 拥有15年以上Python开发与架构经验,曾任阿里巴巴大数据资深专家,具备超700台大规模机器的实战经验。 他精通Hadoop大数据生态与AIGC技术,在LLM模型调优、RAG及LangChain等方面经验丰富。 曾主导网易金融量化分析平台、智能客服系统等多个AIGC项目的研发。

张老师

复旦大学数学科学学院金融工程硕士,上海交大教育集团高级讲师,8年授课实战经验。 曾任职于某征信公司及京东金融,主导供应链风控与信贷风控系统开发,逾期率控制在0.3%以下。 擅长机器学习、深度学习、Python数据分析与挖掘、Power BI可视化等,曾参与多项上海市政项目与企业AI技术研究与实施。

关老师

某跨国公司AI架构师(世界500强),金融行业AI大模型实战讲师,微软专家级和SAFe认证; 16年Java经验,2年LLM企业部署研发实战经验,精通Python、LangChain、微调ChatGLM/LLaVA; 主导智能客服、AI数字人等项目,6年企业级培训经验。

课程大纲

第一阶段:人工智能认知提升

课程内容 课程大纲
人工智能大模型技术的过去、现在与未来 (1)人工智能的发展史——人工智能1.0到3.0时代
(2)大模型的发展史
(3)人工智能的基本原理
大模型应用全景速览 (1)大模型企业应用案例
(2)企业拥抱大模型的痛点与解决方案
体验大模型 体验大模型
大模型工具使用 (1)大模型能力的边界认知
(2)提示词工程

项目:结构化提示词编写与实践

项目:思维导图快速生成

项目:Markdown格式文档快速生成

第二阶段:大模型开发环境部署

课程内容 课程大纲
环境搭建与使用 (1)Linux基本操作和常用命令
(2)Docker基础
(3)XShell操作
(4)人工智能相关基础库介绍与安装
开源大模型部署 (1)Ollama介绍与安装

单机多卡私有化部署开源大模型

(2)常见的开源大模型部署

第三阶段:AI大模型应用开发平台基础

课程内容 课程大纲
AI大模型应用开发平台 (1)Dify平台的介绍与安装
(2)Dify配置基础大模型
(3)Dify创建聊天机器人
(4)Dify创建知识库
(5)Dify创建Agent
(6)Dify创建工作流

项目:意图识别客服机器人

项目:长篇故事生产机器人

第四阶段:大模型研发基础

课程内容 课程大纲
IDE环境搭建 (1)Vscode安装与配置
(2)Jupyter介绍
python编程复盘 (1)Python核心语法
(2)Python文件操作
(3)Python多进程与多线程
数据科学计算库实战 (1)Pandas实战
(2)Numpy实战
人工智能开发框架Pytorch基础 (1)张量基础
(2)全连接神经网络

激活函数、MSELoss、CELoss、正则化L1/L2

项目:手写数字识别--tensorboard使用

(3)卷积神经网络

BatchNormal、IntanceNormal、GroupNormal、Pool、分离卷积、空洞卷积

项目:图像识别

(4)反馈神经网络

门结构、残差结构

项目:时间序列预测

(5)混合精度训练

FP16、BF16

项目:YOLO实战

大语言模型结构详解 (1)注意力机制
(2)Transformer网络结构

GQA、MQA、PE(Rope、绝对位置编码)FlashAttention、FNN、Moe

(3)Deepseek模型架构专题

Share Moe、MLA

项目:预训练模型

Embedding、词向量制作、多机多卡训练、显卡选型

(4)大模型推理

t-softmax、top-k、top-p、重复惩罚、KV-Cache

(5)Clip网络基础

Vit网络设计与训练

(6)多模态大模型网络结构

llava网络结构

第五阶段:大模型能力扩展

课程内容 课程大纲
Langchain基础 (1)Langchain开发环境搭建
(2)链与LCEL基础
(3)记忆模块基础
(4)知识增强检索基础(RAG)
(5)智能体代理基础(AGENT)

项目:Langchain调用私有化部署QWEN2.5大模型

Muti-Agents基础 (1)Muti-Agents基本概念

思维链(Cot、ToT、GoT)

(2)Langgraph基础

常见的其他Muti-Agents框架介绍crewAI和Autogen

(3)AI团队搭建

流程模式、领导者模式

项目:聊天机器人

RAG(milvus、lightRAG、Chroma)、WebSearch

项目:方案撰写专家

项目:MySQL数据库智能代理

第六阶段:大模型微调和底层技术

课程内容 课程大纲
HuggingFace基础 (1)Pipeline基础
(2)Transformers组件基础
(3)Tokenizer组件基础
(4)Datasets组件基础
(5)Evalaute组件基础
(6)Trainer组件基础
显存优化基础 (1)内存、显存基本结构与工作方式
(2)模型显存占有量计算
(3)模型在显存中的存储优化
模型微调基础 (1)大模型训练流程
(2)BitFit微调
(3)Prompt-Tuning微调
(4)P-Tuning微调
(5)Prefix-Tuning微调
(6)LORA微调
(7)IA3微调
(8)模型量化
(9)QLora微调
(10)对齐微调(RLHF\DPO)
(11)实战:微调llama3
模型推理优化基础 (1)vLLM推理框架基础
(2)Llama.cpp基础
多机多卡分布式训练基础 (1)并行基础
(2)Fairscale训练基础
(3)Accelerator训练基础
(4)Deepspeed训练基础
大模型微调实战 (1)大模型微调流程

SFT、DPO和变种、RLHF、PPO、ORPO

(2)HuggingFace/Modelscope基础

Tokenizer、模型加载与保持、模型推理

(3)Deepseek模型训练专题

强化学习(DQN、PG、DDPG、AC、PPO)、GRPO、蒸馏

(4)微调前置基础

显存优化、Adam优化器原理、Zero0/1/2/3

(5)大模型高效微调

Lora、量化、Qlora、SVD、IA3

项目:微调通义千问2.5:7b模型

deepspeed 8卡v100训练

大模型部署与评估 (1)推理框架介绍
(2)Vllm推理基础
(3)大模型评估基础

(4)评估指标解读

混淆矩阵、F1-SCORE、PR、AUC、ROC、R2等

(5)OpenCompass进行大模型评估

评估数据集

第七阶段:项目实战和入职指导

课程内容 课程大纲
智能问答专家 使用自己微调的大模型,叠加自己的知识库,开发一个专业问答专家。例如法律咨询、医疗咨询等。
报告生成能手 使用自己微调的大模型,叠加自己的知识库与智能代理,开发一个报告撰写能手。
数据智能治理专家 利用大模型从海量的、杂乱的文本数据中提取需要的信息,并结构化数据存储。
全流程内容制造者 通过大模型Agent能力对网站进行的监视与内容获取,然后自动的对内容进行分析、摘要、重写,最后自动发布到指定平台。
技术面试指导 基础知识面试指导
项目方案面试指导
行业信息面试指导

联系我们

学校地址

上海市徐汇区乐山路33号交大科技园B栋4层

开放时间

周一至周日 9:00-19:00

联系方式

400-820-7975,微信:qiu297666(张老师)