当前位置: 首页 »  职位信息 »详情

运筹优化大模型算法工程师

发布企业:杉数科技(北京)有限公司 发布时间:2025-08-07 浏览次数:766
职位信息
职位名称 类型 性质 最低学历要求 人数 薪资
运筹优化大模型算法工程师 算法|大数据|AI 全职 硕士 6 20000以上
发布时间 2025-08-07 15:21:01
职位有效期 2026-08-06 23:59:59
专业 不限
工作地址 北京市市辖区东城区;上海市市辖区杨浦区
职位要求

【岗位要求】

1.专业计算机、机器学习,运筹学等方向相关,博士及硕士优先;

2.较强的代码能力,具有较强的模型Post-training(SFT、DPO、PPO等)训练及相关数据处理经验;

3.实战经验Python以及Pytorch等深度学习框架;

4.熟悉Transformer架构以及大语言模型基础知识;

5.善于平衡研究目标及落地实现,且结果导向;

6.良好的沟通和合作能力;

7.关注技术影响力,具有开源开放精神。

【加分项】

1.有强化学习如MCTS, PPO, SAC等实战经验;

2.曾发表顶级会议论文并具有一定的学术影响力,包括但不限于NeurIPS、ICLR、ICML、ACL、CVPR、ECCV、OSDI、SOSP等;

3.有知名开源库的开发、贡献或维护经验;

4.在ACM、Kaggle、天池等竞赛中获奖。

备注说明:

杉数科技运筹优化大模型算法工程师, 共同推动AI在大语言模型数学建模,运筹优化大模型的持续迭代与改进:包括SFT, Reward模型,DPO对齐及训练研发,保证模型的基础能力,以及应用RLHF 相关研究提升模型上限,并探索模型在如数学建模,运筹优化等复杂场景的推理能力。

【工作地点】上海


政治面貌 无要求
实习实践经验 有要求
职位简介 1.开展日常数据迭代实验,如数据合成,SFT, 持续快速提升模型的基础能力并应用于业务场景; 2.进行Post-training的框架搭建与迭代,如Process reward model 训练策略,如模型蒸馏策略、MOE训练策略等; 3.开展RLHF、Multi-Agent RL、Self-play RL等研究,提升Reward Signal丰富度和质量,并设计、执行和分析实验,从而提升模型能力上限,包括但不限于提升模型的逻辑推理、幻觉抵抗、人类偏好等能力; 4.参与开发 Post-training 所需工程框架开发,如 RLHF 框架、开源相关Post-training框架适配等; 5.参与相关领域模型能力评测及评测数据和评估标准的迭代,持续跟进国内外最新测评和模型使用反馈; 6.开发实验、研究、评测、内部部署相关的工具,帮助团队提升效率要求。 投递网址:https://www.shanshu.ai/recruit
岗位职责

【岗位职责】

1.开展日常数据迭代实验,如数据合成,SFT, 持续快速提升模型的基础能力并应用于业务场景;

2.进行Post-training的框架搭建与迭代,如Process reward model 训练策略,如模型蒸馏策略、MOE训练策略等;

3.开展RLHF、Multi-Agent RL、Self-play RL等研究,提升Reward Signal丰富度和质量,并设计、执行和分析实验,从而提升模型能力上限,包括但不限于提升模型的逻辑推理、幻觉抵抗、人类偏好等能力;

4.参与开发 Post-training 所需工程框架开发,如 RLHF 框架、开源相关Post-training框架适配等;

5.参与相关领域模型能力评测及评测数据和评估标准的迭代,持续跟进国内外最新测评和模型使用反馈;

6.开发实验、研究、评测、内部部署相关的工具,帮助团队提升效率要求。


单位信息
单位名称 杉数科技(北京)有限公司
单位性质 其他企业 单位行业 信息传输、软件和信息技术服务业
标签 高新技术企业
隶属单位 下属单位 单位官微
单位图片
视频介绍
单位介绍
单位简介

杉数科技(北京)有限公司成立于2016年7月,总部位于北京,并在上海设有子公司。 同年8月,杉数科技获得了来自真格基金和北极光创投的天使轮融资;2017年7月完成约4000万元 A 轮融资,由高达投资(Pagoda Investment)领投,将门创投、联想创投跟投;2020年3月完成近亿元B轮融资,同时引入万科集团以及天任投资两个重要战略股东;2021年6月宣布完成近2亿元C轮融资,由中银国际领投、天任投资跟投。

杉数科技由四位斯坦福大学博士联合创立,拥有由超过30位海内外一流大学教授组成的科学家团队,具有国内外领先的、不可复制的一流研发水平。依托于行业领先的大规模优化求解和复杂决策建模能力,杉数科技打造以中国首个商业求解器“Cardinal Optimizer”为核心,可真正实现从数据到决策端到端服务的决策产品平台,以完整的技术能力和高度模块化的产品结构灵活高效地为企业赋能,利用数据为企业带来收益及成本端的显著变化,让每一个企业拥有定制最优化决策的能力。

目前,杉数科技已涵盖了零售、物流、电商、工业制造、航空航天、能源等各主流行业,获得包含百威、好丽友、海尔、六国化工、上海通用、滴滴、顺丰、德邦以及万达在内的近百家龙头企业的青睐。

 

我们是一支高速成长的团队,在这里,你站在金字塔,拥有无限的空间,独当一面的能力,简单可信赖的文化,还有我们深藏已久的梦想。

企业文化

晋升通道

福利待遇

在杉数你将获得的:

风口行业:未来无限可能的大数据决策行业;

成长环境:年轻活力的精英团队,跟随行业顶尖大牛在实战项目中快速累积经验;

薪酬工资:有竞争力的薪酬,激励制的薪酬体系;

基础保障:五险一金+补充医疗保险+午餐补助+年度体检;

品质生活:现磨咖啡、各式茶饮零食、每日水果,随时补充你工作的能量;

健身房福利、定期团建和年度旅游,杉数人会工作更会生活。

培训体系

考核方式

其他说明


宣讲信息
宣讲名称 类型 举办地点 举办日期 查看详情
暂无信息
双选会信息
名称 类型 地址 时间 查看详情
暂无信息
招聘信息
职位名称 查看详情
大模型技术实习生 点击查看
售前实习生 点击查看
产品经理实习生 点击查看
算法工程师 点击查看
数据分析师 点击查看
售前实习生 点击查看