跳到主要内容
Alibaba Intelligent Engine · AI Infra

加入 ROCK 与智能引擎 AI Infra 团队

智能引擎部门隶属于阿里巴巴控股集团平台技术,主要负责阿里集团内部搜推广工程系统和 AI 相关工程系统的开发和能力建设,同时 AIGC 的蓬勃发展为智能引擎注入了新的活力:如何解决大模型的训推等性能和成本问题,如何优化大模型研发范式、应对大模型在线服务带来的新挑战,都是我们在 AI 时代下的新命题。

我们致力于为集团用户提供从数据开始,到训练、评测、预测、应用开发、解决方案的完整工程体系。团队和 Happy 家族模型算法团队密切协同,共同研发多模态生成大模型,承担阿里集团多模态生成模型研发的重任。

我们拥有浓厚的技术氛围,本着开源共享的精神贡献了 ROLL、Megatron-LLaMA、XDL、Euler 等众多优秀的开源产品,坚持以开放的姿态与行业共享成果、共赢共进。

我们是谁

方向亮点

搜索&管控平台负责构建阿里集团大语言模型和多模态模型的基础工程平台,团队致力于为大语言模型提供大规模 Agent 训练环境,也为 HappyHorse、HappyOyster 系列模型提供极致的推理服务能力。

大规模 Agent 训练环境

面向后训练、评测和数据生产场景,构建大规模智能体训练环境框架 ROCK,支撑强化学习环境的开发、部署和管理。

大模型基础工程平台

构建阿里集团大语言模型和多模态模型的基础工程平台,支撑 HappyHorse、HappyOyster 系列模型的训练、评测、预测和应用开发链路。

多模态理解与生成推理

围绕 VL、Omni、DiT、Diffusion Model 和 AR 架构,建设从底层算子到推理服务调度的全栈优化体系,在精度、性能和成本之间取得最佳平衡。

HappyHorse 推理工程落地

负责行业顶尖多模态理解和生成模型在 AI 创新应用场景的推理落地,覆盖推理架构设计、全链路服务编排和性能极致优化。

Selected Results

关键成果精选

我们是阿里 HappyHorse 推理工程团队,负责行业顶尖的多模态理解和生成模型在 AI 创新应用场景的推理落地,涵盖从推理架构设计、全链路服务编排到性能极致优化的全栈技术挑战。

Open Source

开源训练框架与系统

Megatron-LLaMA

基于 Megatron 的大语言模型开源训练框架,支持高效分布式 LLM 训练。

LLMPyTorch
GitHub

X-DeepLearning (XDL)

阿里巴巴开源的稀疏模型训练框架,支持大规模推荐和广告场景。

SparseRecSys
GitHub

ROLL

强化学习开源训练框架,支持大规模 RL Post-Training 的高效分布式执行。

RLDistributed
GitHub

ROCK

开源的强化学习环境开发框架,旨在简化强化学习环境的开发、部署和管理流程。

RL EnvAgent
GitHub

Euler

阿里巴巴开源的分布式图学习引擎,支持大规模图神经网络训练。

GNNGraph
GitHub

RecIS

预估大模型训练框架,面向推荐和广告场景的工业级大模型训练系统。

RecSysTraining
GitHub

Open Roles

开放岗位

点击岗位名称或投递按钮进入阿里人才页面。

Application

如何加入

  1. 选择上方岗位,进入阿里控股招聘页面登录后投递。
  2. 也可以一键投递到邮箱 lxm02049624@alibaba-inc.com,并添加 HR 微信咨询:19952378952。
  3. 联系发布岗位信息的阿里同学帮忙内推。