我们用AI 赋能,为 200 多个行业客户提供AI 解决方案,并顺利实现了商业化,积累了丰富的经验。AI技术快速发展,尤其是大模型的出现及火爆,导致了就业市场出现了相关人才的短缺,面对此类工作岗位人才的巨大缺口,我们运用自身6年的人工智能项目经验,结合当下不断迭代的最新AI技术,研发出适合当前就业市场需求的AI大模型算法工程师课程,促使越来越多的有志之人投身于人工智能大发展的浪潮中。
✔ 上海、苏州、杭州、北京、深圳等多家AI合作企业
✔ 推荐入职上述企业的人工智能及相关研发岗位工作
✔ 通过考核的学员获得上海交大教育AI大模型算法工程师培训证书
✔ 学习未达标者,提供免费重修服务
✔ 熟悉各类AI大语言模型和多模态大模型,能私有化部署;
✔ 熟练使用 LangChain等框架,对RAG,Agent有深入理解和思维链设计。;
✔ 负责相关产品的模型训练和服务部署;
✔ 对主流的大模型(GPT、文心一言、百川、chatGLM、通义、LLaMA等)有较丰富的使用经验和prompt微调经验;
✔ 掌握大语言模型SFT/LoRA/RLHF等技术,提升特定任务的大模型能力;
✔ 熟练掌握主流深度学习框架pytorch,LLM训练并行框架Deepspeed等多机多卡方案;
✔ 跟踪大模型领域前沿技术,提出创新思路来推动算法升级和业务发展。
| 岗位名称 | 工作经验 | 岗位职能 |
|---|---|---|
| AI大模型算法工程师 | 一年至三年 | 能够应用相关工具和框架进行大模型的微调和优化 |
| 大模型算法高级工程师 | 三年以上 | 对大模型的训练和部署有深入理解,能够独立完成与大模型相关的各种项目 |
| 算法专家 | 五年以上 | 熟悉常见的机器学习和深度学习算法,具备扎实的算法功底和编程能力 |
| 技术总监/CTO | 十年以上 | 管理层,组建技术团队并带领技术团队开展产品研发、测试以及保证项目顺利交付的能力 |
温同学
有机化学博士后,毕业于中科院化学所,后进入医药公司从事结构生物学和药物的研究,但是发现很多以前解决不了的问题可以通过人工智能技术解决。因此通过各种渠道了解,决定学习人工智能。坐标上海,**上市公司,做3d人脸识别。
唐同学
经过几个月的学习,可以学到真东西,真正踏入人工智能的行业,毅然全职参加学习。信息管理与信息系统专业,之前在上海做DBA,后面看好AI这个赛道。坐标上海阿里巴巴旗下**企业担任算法工程师。
张同学
本科,内江师范学院;测绘专业,毕业后做了一段时间本专业工作。当初是因为表弟建议说人工智能行业发展好,就过来学习了,同桌是计算机专业的也对他有很大帮助,让完成了从零到一。坐标上海某公司。
李同学
研究生,中科院光电所;计算机视觉,研二过来学习,应届研究生过来参与项目。目前在坐标上海拼多多,担任算法工程师。
黄同学
本科,四川外国语大学;英语专业,重庆人,毕业后从事人事工作两年,后面看好人工智能行业转型。坐标在上海*车企,担任算法工程师。
阙同学
本科,石河子大学;电信专业,之前是同学在这里学习工资高,就打算转行过来了。目前坐标上海,上海****科技有限公司。
丁同学
本科,青岛大学;信息工程学院-网络工程,西安人,之前在西安做了两年运维工程师,后面因为看好AI的赛道,从西安过来学习人工智能。目前在坐标上海某大厂担任算法工程师。
陈同学
本科,西南民族大学;因为大学期间就自学过一些机器学习和神经网络,但是也知道自己还是比较欠缺经验和项目而且也不是很体系,看了下体系确实很不错主要是本身也是AI公司就过来了.目前坐标东莞,步步高。
移动端开发,C++/Java有项目研发经验,代码能力强,学习后薪资涨幅较高。
计算机、人工智能、软件工程、数学、电子信息等相关的专业,本科及硕士人群。
项目管理、产品经理、或者细分行业准备做智能化升级的负责人。
已在AI领域发展,期望进行大模型研发的从业者。
上海交大教育(集团)有限公司于1999年8月4日设立,注册资本1.5亿元人民币,股东为上海交大产业投资管理(集团)有限公司和上海新南洋昂立教育科技股份有限公司。集团以独立法人经济实体的形式对外发展终身教育事业,传承 “起点高、基础厚、要求严、重实践、求创新”的醇厚传统,秉持“严谨、务实、创新”的质量方针,为打造社会化教育平台,充分发挥自身在教育、人才、技术及信息方面的资源和优势并服务于社会。
基础阶段(选修):Python开发和数据分析
| 课程内容 | 课程大纲 |
|---|---|
| Python开发基础 |
1、Python概述 2、Python语法基础 3、函数 4、内置函数 |
| Python开发进阶 |
(1)Python面向对象高级编程 (2)模块 (3)Python正则表达式 (4)Python与数据库编程 (5)Python多进程与进程间通信 (6)Python多线程 (7)项目实践 |
| Python数据分析 |
1. 数据科学和AI概述 2. 数据结构和算法 3. Python 数据分析与数据挖掘简介、环境搭建 4. Python数据分析工具箱 5. 数据加载与存储 6. 数据规范化和处理 7. 数据分析、数据挖掘、数据可视化 |
第一阶段:人工智能时代的定位与竞争力
| 课程内容 | 课程大纲 |
|---|---|
| 人工智能的技术演进史、技术架构 |
(1)人工智能技术演进史 --从规则系统到神经网络 --AI产业格局 (2)技术基本原理与分层架构 --算力、算法、数据铁三角 --PyTorch与TensorFlow |
| 大模型和AIGC入门讲解 |
(1)大模型定义与演进 (2)AIGC的技术栈与企业级流水线 |
| 体验大模型 |
体验大模型 |
| 大模型企业应用解决方案讲解 |
(1)行业解决方案 (2)实施路线图 |
| 实战工作坊 |
(1)工作场景、学习场景、生活场景、社交与个人成长场景提示词 (2)专业咨询与高级提示词 |
| 定位与竞争力 |
数字体力向数字脑力转型的定位与竞争力分析 |
第二阶段:意图驱动Vibe Coding实战
| 课程内容 | 课程大纲 |
|---|---|
| 搭建AI大模型开发环境 |
(1)Linux基本操作和常用命令 (2)Docker基础 (3)XShell操作 (4)国产操作系统部署与使用 |
| AI算力配置 |
(1)算力概述 (2)本地算力使用与讲解 (3)云端算力配置与使用 |
| 开源AI大模型部署 |
(1)Ollama部署 配置局域网访问与单机多卡使用 (2)主流开源大模型部署与使用 |
| Vibe Coding实战 |
(1)高阶系统提示词 (System Prompts) 与架构建模 (2)利用 TRAE、Cursor、Claude 实现全链路意图驱动开发 (3)自然语言驱动的代码重构、测试与系统维护 |
第三阶段:数据探索EDA与深度学习
| 课程内容 | 课程大纲 |
|---|---|
| 面向大模型的 EDA 与特征工程 |
(1)数据探索EDA (2)垃圾进,垃圾出(GIGO) (3)理解数据分布如何影响效率 |
| 从感知机到深度学习 |
(1)多层感知机 (MLP)、激活函数、梯度下降与反向传播算法(BP) (2)损失函数 (Loss Function) 、激活函数 (3)模型训练过程 (4)FNN原理与实战 (5)CNN原理与实战 (6)RNN原理与实战 (7)LSTM原理与实战 (8)GRU原理与实战 (9)预训练模型、公开数据集与竞赛 (10)不同神经网络的应用场景分析 (11)神经网络的Web服务化 |
第四阶段:AI大模型全生命周期
| 课程内容 | 课程大纲 |
|---|---|
| 论文《Attention is All You Need》解析 |
(1)Self-Attention(自注意力机制)、多头注意力 (2)位置编码 (3)Encoder-Decoder 架构 (4)Bert与GPT源码分析 |
| AI大模型架构演进 |
(1)从单体 Transformer 到 MoE(混合专家模型) 的架构 (2)AI大模型预训练与微调 (3)Bert、GPT、LLama、Deepseek架构对比与选型 |
| AI大模型量化 |
(1)量化的定义 (2)量化实战(AWQ、GGUF等) (3)AI大模型蒸馏 |
| AI大模型高效微调 |
(1)PEFT(Parameter-Efficient Fine-Tuning)微调 (2)实战 LoRA、QLoRA (3)实战IA3与其他微调 (4)LLamaFactory实战 (5)实战:微调GPT、Bert、Qwen |
| AI大模型对齐 |
(1)RLHF人类道德对齐 (2)PPO与DPO算法 |
| AI大模型推理加速与vLLM引擎 |
(1)KV Cache优化与FlashAttention (2)实战部署vLLM (3)对比ollama与vLLM |
| 开源AI大模型选型与对比 |
(1)模型范式差异 (2)场景与任务映射 (3)选型决策 |
| AI大模型多模态 |
(1)交叉注意力机制 (2)多模型预训练模型(LLaVA、Qwen VL\TTS、Deepseek OCR) |
| AI大模型API访问 |
(1)Deepseek API key (2)兼容第三方的API key |
第五阶段:智能体系统与多Agent协作
| 课程内容 | 课程大纲 |
|---|---|
| 从LangChain 到 LangGraph |
(1)开发环境搭建 (2)LangChain 的表达式语言 (LCEL) (3)反思 (Self-Reflection) 和 计划 (Planning) 能力的单体 Agent (4)实战 LangGraph,利用“图”的思想管理 Agent 的循环逻辑和持久化状态。 |
| MCP、OpenClaw与工具箱(Skills) |
(1)实战 MCP (Model Context Protocol),将企业内部数据库、本地文件和三方 API 统一抽象为模型的“上下文接口”。 (2)介绍OpenClaw 或类似框架,开发具备网页操作、GUI 交互能力的自动化 Agent,实现从“口头指挥”到“自动操作”的跨越。 (3)技能 (Skills) 库工程化 (4)Function Calling 的稳定性调优 |
| 企业级低代码平台 |
(1)Dify、MaxKB、Coze平台简介与部署 (2)多智能体协作 (MAS) 模式: 设计“主从模式”、“对等模式”等协作拓扑。模拟企业真实岗位(如:产品经理 Agent + 程序员 Agent + 测试 Agent),处理复杂的长链业务。 (3)企业应用闭环: 针对电信、软件研发等实际场景,完成一个从需求分析到自动化执行的完整 Agent 项目 |
| Agent架构选型 |
(1)产品经理快速选型 (2)基于业务复杂度的Agent架构选型 |
| Openclaw与Hermes |
(1)Openclaw安装、配置与skill使用 (2)Hermes安装、配置与使用 |
第六阶段:知识增强架构RAG
| 课程内容 | 课程大纲 |
|---|---|
| 实战LLamaindex与RAGAS |
(1)LlamaParse 对复杂 PDF、表格及多模态文档的语义化提取 (2)Recursive Retrieval(递归检索)与 Small-to-Big(由点及面)检索 (3)混合检索 (Hybrid Search),向量语义检索 + BM25 关键词检索”的加权融合(RRF 算法) (4)精排架构 (Reranking)叉编码器 (Cross-encoders) (5)查询转换 (Query Transformation) (6)ragas对RAG进行评估 |
| GraphRAG 与 Agentic RAG |
(1)图谱增强 (GraphRAG)利用图数据库(Neo4j)构建实体关联 (2)Agentic RAG (自反思检索): 设计具备“检索-评估-重检索”闭环能力的智能体。如果模型发现召回内容不匹配,能自主触发重新搜索或扩大搜索范围。 (3)RAG 评估体系 (Ragas/TruLens): 构建量化的评估流水线 |
| 企业级RAG项目实战 |
从0到1的项目实战 |
第七阶段:企业级AI应用项目闭环
| 课程内容 | 课程大纲 |
|---|---|
| 算力适配 |
(1)华为昇腾算力适配 (2)通用算力适配 |
| 容器化部署 |
(1)docker构建 (2)docker部署 (3)docker compose实战 |
| 全栈可观测性与监控 |
(1)AI 专项指标监控 (2)普罗米修斯 |
| 企业级评估体系 |
(1)LLM-as-a-Judge 模式,针对 RAG 和 Agent 的性能进行量化打分。 (2)建立 HITL(人机协作) 反馈机制 |
| 技术面试指导 |
基础知识面试指导 项目方案面试指导 行业信息面试指导 |
| 沟通能力提升 |
(1)金字塔法则 (2)STAR法则 |
上海市徐汇区乐山路33号交大科技园B栋4层
周一至周日 9:00-19:00
400-820-7975,微信:qiu297666(张老师)