v1.9.0
发布日期
2026 年(待发布)
SDK 相关改动
新功能
-
SDK: 支持 GPU 参数配置 (#1047)
-
SDK:
rock datasets list支持跨 region OSS 快速列出数据集 (#1010) -
SDK:
rock storage get命令,支持从 OSS 下载归档的沙箱日志 (#962)
Bug 修复
沙箱 (Sandbox)
新功能
-
支持沙箱重启 (restart) 功能 (#1001)
-
新增
/delete端点,STOPPED 状态的沙箱可级联转为 DELETED(支持--rm容器自动清理)(#1038) -
引入 SandboxStateMachine,统一管理沙箱生命周期状态流转 (#988)
-
Admin 端新增 ops-jobs API,支持 DB 持久化状态和多 Pod 安全并发 (#1027)
-
Admin 端新增 API 参数校验 (#985)
-
K8s Operator 支持磁盘配额限制 (#994)
Bug 修复
-
修复 #988 FSM 重构后 stop reason 丢失的问题 (#1021)
-
修复 RayOperator.get_status() 中 actor 不存在时的异常处理 (#1062)
-
修复 K8sOperator.get_status() 中 CRD 不存在时的异常处理 (#1068)
-
修复沙箱 stop() 时 start_time 缺失导致 stop_time 未写入的问题(start 失败的沙箱)(#1020)
-
修复 start() 未正确委托到 start_async() 导致 meta store 写入缺失的问题 (#1051)
-
修复 Admin SandboxTable 在 DB 重启后连接失效时的重试机制 (#987)
重构
- Meta-store: 新增 Redis 合并语义,支持 archive 和 alive-key 字段过滤 (#1037)
部署 (Deployments)
新功能
-
Docker 容器创建拆分为
docker create+docker start -a,支持更精细的容器生命周期控制 (#1012) -
Docker rootfs XFS 项目 ID 与沙箱日志目录共享配额 (#1013)
任务调度 (Scheduler)
新功能
-
FileCleanupTask 切换到
find -delete,并增加最小路径安全检查 (#967) -
新增 SandboxLogArchiveTask:基于 DB 驱动的沙箱日志归档任务,替换旧的 sentinel 文件方案 (#1025)
-
Ray 日志清理增强:(#1029)
-
PART 1 清理
runtime_env_setup-*文件(覆盖 hex 后缀) -
PART 2 清理轮转的 daemon 日志(
raylet.N.out、gcs_server.N.err等) -
session_latest/logs支持 PID 感知清理 +logs/old目录清理 -
保护
agent-*等 daemon 文件不被 PID probe 误清
-
-
配置去重:通过 base config 继承机制消除 region 级别的 scheduler.tasks 重复配置 (#1003)
Bug 修复
-
FileCleanupTask: 修复
exclude_dirs白名单机制因-depth导致-prune失效的问题,改用-not -path(#1072) -
FileCleanupTask: 修复
check_pid_exists中 PID/TID 复用导致的误判,增加进程名验证 (#1074) -
FileCleanupTask:
_discover_candidates使用find -type d避免误匹配 daemon 日志文件 (#1025) -
ImageCleanupTask: 拆分 prune(幂等操作)和 docuum 启动逻辑 (#1023)
-
SandboxLogArchiveTask: 修复跨事件循环调用 asyncpg 连接池的问题,DB 调用派发回主循环 (#1025)
-
Scheduler: 增加 60s 超时限制防止跨循环 dispatch 挂起 (#1025)
Rocklet
新功能
- 新增 rootfs/log/kata 分盘使用率监控 (#983)
Bug 修复
-
修复 PR #985 引入的 NonBlankStr 校验导致
/execute和/read_file返回 422 的回归 (#1065) -
修复 UploadResponse 中
success和file_name未正确设置的问题 (#1060) -
使用 cgroup 指标获取容器内存,替代 psutil(修复 DinD 场景下指标不准的问题)(#1017)
Harbor (Agent Job)
新功能
- Harbor 环境配置新增 tracking 支持,Job 配置新增 tracking config 和 api_key 字段 (#999)