项目介绍

RecIS 是什么

RecIS 是一个专为超大规模稀疏模型设计的统一架构深度学习框架。它基于 PyTorch 开源生态构建。为稀疏训练，或稀疏和多模态/大模型结合计算提供了完整的解决方案。

设计目标

超大规模支持: 面向超大规模稀疏模型统一架构
高性能: 基于 PyTorch 开源生态，支持稀疏模型分片优化
易用性: 提供简洁的 API 设计，支持原生计算优化技术
兼容性: 与现有 PyTorch 生态完全兼容

核心架构

RecIS 采用模块化设计，主要包含以下核心组件：

IO 层

负责ORC数据读取和预处理，提供多线程处理 / 数据预取 / 状态记录等优化能力

特征处理层

提供特征工程和特征转换处理能力，并支持转换算子融合优化策略

计算层

稀疏计算：基于 HashTable 的动态 embedding，支持特征淘汰
稠密计算：原生 PyTorch 支持

训练框架层

提供完整的训练、评估和模型管理能力

应用场景

RecIS 特别适用于以下场景：

推荐系统: 大规模稀疏特征的推荐模型训练
广告系统: CTR/CVR 预估模型
搜索排序: 搜索结果排序模型
多模态学习: 结合文本、图像等多模态数据的模型

技术优势

稀疏计算优化

动态扩张的 embedding 表
高效的 HashTable 实现
稀疏参数分片和优化
支持特征淘汰策略

IO 性能优化

多线程并行读取处理数据
支持数据预取
支持数据直接打包到GPU / pin_memory

分布式训练

原生支持分布式训练
梯度累积和同步优化
模型并行和数据并行

计算优化

混合精度训练
算子融合优化