| 职位名称 | 类型 | 性质 | 最低学历要求 | 人数 | 薪资 |
| 运筹优化大模型算法工程师 | 算法|大数据|AI | 全职 | 硕士 | 6 | 20000以上 |
| 发布时间 | 2025-08-07 15:21:01 | ||||
| 职位有效期 | 2026-08-06 23:59:59 | ||||
| 专业 | 不限 | ||||
| 工作地址 | 北京市市辖区东城区;上海市市辖区杨浦区 | ||||
| 职位要求 | 【岗位要求】 1.专业计算机、机器学习,运筹学等方向相关,博士及硕士优先; 2.较强的代码能力,具有较强的模型Post-training(SFT、DPO、PPO等)训练及相关数据处理经验; 3.实战经验Python以及Pytorch等深度学习框架; 4.熟悉Transformer架构以及大语言模型基础知识; 5.善于平衡研究目标及落地实现,且结果导向; 6.良好的沟通和合作能力; 7.关注技术影响力,具有开源开放精神。 【加分项】 1.有强化学习如MCTS, PPO, SAC等实战经验; 2.曾发表顶级会议论文并具有一定的学术影响力,包括但不限于NeurIPS、ICLR、ICML、ACL、CVPR、ECCV、OSDI、SOSP等; 3.有知名开源库的开发、贡献或维护经验; 4.在ACM、Kaggle、天池等竞赛中获奖。 备注说明: 杉数科技运筹优化大模型算法工程师, 共同推动AI在大语言模型数学建模,运筹优化大模型的持续迭代与改进:包括SFT, Reward模型,DPO对齐及训练研发,保证模型的基础能力,以及应用RLHF 相关研究提升模型上限,并探索模型在如数学建模,运筹优化等复杂场景的推理能力。 【工作地点】上海 |
||||
| 政治面貌 | 无要求 | ||||
| 实习实践经验 | 有要求 | ||||
| 职位简介 | 1.开展日常数据迭代实验,如数据合成,SFT, 持续快速提升模型的基础能力并应用于业务场景; 2.进行Post-training的框架搭建与迭代,如Process reward model 训练策略,如模型蒸馏策略、MOE训练策略等; 3.开展RLHF、Multi-Agent RL、Self-play RL等研究,提升Reward Signal丰富度和质量,并设计、执行和分析实验,从而提升模型能力上限,包括但不限于提升模型的逻辑推理、幻觉抵抗、人类偏好等能力; 4.参与开发 Post-training 所需工程框架开发,如 RLHF 框架、开源相关Post-training框架适配等; 5.参与相关领域模型能力评测及评测数据和评估标准的迭代,持续跟进国内外最新测评和模型使用反馈; 6.开发实验、研究、评测、内部部署相关的工具,帮助团队提升效率要求。 投递网址:https://www.shanshu.ai/recruit | ||||
| 岗位职责 | 【岗位职责】 1.开展日常数据迭代实验,如数据合成,SFT, 持续快速提升模型的基础能力并应用于业务场景; 2.进行Post-training的框架搭建与迭代,如Process reward model 训练策略,如模型蒸馏策略、MOE训练策略等; 3.开展RLHF、Multi-Agent RL、Self-play RL等研究,提升Reward Signal丰富度和质量,并设计、执行和分析实验,从而提升模型能力上限,包括但不限于提升模型的逻辑推理、幻觉抵抗、人类偏好等能力; 4.参与开发 Post-training 所需工程框架开发,如 RLHF 框架、开源相关Post-training框架适配等; 5.参与相关领域模型能力评测及评测数据和评估标准的迭代,持续跟进国内外最新测评和模型使用反馈; 6.开发实验、研究、评测、内部部署相关的工具,帮助团队提升效率要求。 |
||||
| 单位名称 | 杉数科技(北京)有限公司 |
|
|||||||||||||||||
| 单位性质 | 其他企业 | 单位行业 | 信息传输、软件和信息技术服务业 | ||||||||||||||||
| 标签 | 高新技术企业 | ||||||||||||||||||
| 隶属单位 | 下属单位 | 单位官微 | |||||||||||||||||
| 单位图片 | |||||||||||||||||||
| 视频介绍 | |||||||||||||||||||
| 单位介绍 |
|
||||||||||||||||||
| 宣讲名称 | 类型 | 举办地点 | 举办日期 | 查看详情 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 暂无信息 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 名称 | 类型 | 地址 | 时间 | 查看详情 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 暂无信息 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||