智慧芽,作为全球领先的科技创新与知识产权信息服务提供商,我们致力于通过先进的AIGC技术,推动知识产权服务的革新。作为“全球独角兽”企业,我们在中国市场的知识产权信息服务领域稳居第一。在AIGC时代,智慧芽始终走在行业前列,率先完成国家网信办备案,成功发布专利大模型、生物医药大模型,并推出研发创新与知识产权领域的A助手「芽仔」,我们的专业能力已超越通用大模型。
2025届优秀毕业生(2024年9月至20253年8月期间毕业),计算机、数学等相关专业。
1. 领域数据抽取,针对生物医药、知识产权、材料、通信等领域的文本、表格、图片等多模态数据进行抽取;
2. 构建和迭代大规模语义检索系统;
3. 负责LLM相关底层技术的研究与实现,生成式大模型优化及业务场景实现;
4. 独立阅读论文,调研解决方案,设计实验,并对现有系统进行改进;
5. 通过 SFT、PEFT,DPO/PPO 等技术对齐大模型并业务落地;
1. 熟悉Python/Java/C++等其中至少一种语言,有较强的工程能力;
2. 熟悉常用机器学习/深度学习算法,熟悉 tensorflow、pytorch 等深度学习框架,有大规模分布式训练经验优先;
3. 理解GPT相关原理,如prompt、finetuning、transformer等关键技术;
4. 有信息抽取(实体识别、关系抽取、事件抽取)、机器阅读理解(文档理解、表格理解)、信息检索(文本表示学习、混合检索)相关经验;
5. 熟悉大模型原理及高效参数微调技术;
6. 工作认真负责,善于沟通,有较强的团队意识;善于学习;
1. 负责AI模型的推理优化、模型加速及部署;
2. 负责模型推理的故障排除和性能调试,持续迭代优化推理架构;
3. 负责基础设施和工具开发,创建和维护AI模型推理的基础设施和工具,包括模型转换、部署、监控和调试等,提高模型部署效率。
1. 熟悉常用的的深度学习模型转换框架;有FasterTransformer/TensorRT/Triton等部
2. 署经验者优先:
3. 熟悉深度学习模型网络结构及其剪枝,量化等模型压缩优化技术,特别是
4. Transformer结构的模型:
5. 有AI模型推理实践经验,熟悉大模型推理优化技术工作原理者优先;
6. 具备优秀的逻辑思维能力,对解决挑战性问题充满热情,善于解决问题和分析问题。
十余年积累,拥有20亿条覆盖全球的深度结构化创新数据,包括1.9亿+专利数据、8.9亿+学术数据、1.3亿+化学数据、1.9亿+法律数据、2.5亿+企业数据、9万+新闻数据等。
Ø 垂类大模型预训练和对齐技术研究:负责LLM相关底层技术的研究与实现,应用SFT、PEFT、DPO/PPO等先进技术,对齐大模型以实现最佳业务效果。
Ø RAG架构技术研究:构建和迭代大规模语义检索系统,让海量信息触手可及。
Ø 垂类多模态大模型技术研究:深入生物医药、知识产权、材料科学、通信等领域的复杂数据进行多模态大模型训练及运用多模态技术进行信息抽取等。
网申-笔试-面试-发放Offer
一键投递:通过智慧芽官方网站或相关招聘平台进行网申-https://patsnap1.zhiye.com/
更多信息,请访问智慧芽官方网站。
智慧芽,期待与你一起,让未来触手可及。