26.06 【AI Inference】智能路由-cache-indexer重构优化 转测 一、度量数据 代码检视缺陷密度目标:16个/KLOC 开发者测试缺陷密度目标:4个/KLOC 责任人 代码类型 代码量(KLOC) 有效缺陷数 检视缺陷密度(数量/代码量) 说明(未达目标则需进行异常原因说明) 发现缺陷数 缺陷密度(个/KLOC) 说明(未达目标则进行异常原因说明) 后台[16,13,19] 前台[13,10,16] [4,2,8] 郑钦文 后端 3.1 41 13.2 / 7 2.3 / 郑钦文 测试 2.5 - - - - - - 二、特性转测checklist 要求 评估项 评估责任人 评估结果 备注 完成了代码Review和开发自测,特性开发质量指标满足质量要求(或提供了合理的原因说明,或补充了质量活动) 要求DT行覆盖率>50%; 推荐DT行覆盖率>80% 郑钦文 是/否(覆盖率69.8%) 计划转测后补充至80%+ 编译构建错误清零 是/否/不涉及 / 开源义务履行:SCA问题清零; 是/否/不涉及 / Issue解决:上版本遗留问题100%按计划解决;严重及以上问题清零; 是/否/不涉及 / 设计完备性 提供社区需求设计文档链接:需求设计完成sig组内评审、遗留问题闭环; 郑钦文 是/否/不涉及 - 需求设计文档:《ofep-0053-cache-indexer重构增强》 https://gitcode.com/openFuyao/ofep/pull/82 - SIG评审:在AI Inference SIG 4/25例会完成评审 - 会议纪要:https://etherpad.openfuyao.cn/p/sig-ai-inference - 遗留问题闭环:已闭环,会议评审意见与修改见ofep评论区 提供社区继承需求、新增需求完整清单; 是/否/不涉及 本次为完整Go重构,原python版本无提案 提供特性级测试用例列表:需完成QA sig组评审和遗留问题闭环; 是/否/不涉及 见邮件附件测试用例表格 - SIG评审:在AI Inference SIG 5/14例会完成评审 - 遗留问题闭环:已闭环。测试用例总数补充至48个,P0/P1用例数量调整至目标比例。 交付件完备性 提供交付件清单、未交付清单,及未交付件的未交付说明 郑钦文 是/否/不涉及 - chart包:oci://cr.openfuyao.cn/charts/cache-indexer:0.0.0-latest - 镜像:or.openfuyao.cn/openfuyao/cache-indexer:latest - 代码仓库:https://gitcode.com/openFuyao/cache-indexer 提供特性描述文档、接口说明文档等测试支撑资料 是/否/不涉及 特性相关资料转测后补齐 功能完备性 提供本特性已交付需求/本次交付需求/未交付需求清单、及未交付需求的相关说明 郑钦文 是/否/不涉及 所属IR:智能路由 优化KVCache感知能力,新增路由策略强化NPU算力感知 特性SR:cache-indexer 项目重构优化,增加L3级别KVCache感知能力,tokenizer环节转移至智能路由 本次交付: 1. cache-indexer GO重构版本 2. kVCache感知: L1级能力重构,L3级能力新增 3. tokenizer环节转移到智能路由,命中率查询接口变更 未交付:无 开发已完成该特性级需求基本功能验证,且验证结论为通过。 是/否/不涉及 特性级测试用例执行通过,且无严重及以上问题。 提供遗留问题清单,遗留问题需经过sig组评审通过 是/否/不涉及 / 测试完备性 特性级测试用例自动化率>80% 郑钦文 是/否(覆盖率%) 特性自动化测试用例转测后补齐 三、测试关注 测试建议 cache-indexer使用指南见README:https://gitcode.com/openFuyao/cache-indexer/blob/master/README.md - 独立部署:支持独立部署,至少需要部署vLLM-ascend+mooncake master才可使用完整功能 - InferNex集成部署:InferNex/master分支已支持集成部署最新cache-indexer,端到端测试建议只开启智能路由(消费者)、cache-indexer以及inference-backend(vLLM-ascend 已包含mooncake); cache-indexer 规格: - 推理引擎:目前仅支持vLLM-ascend,已验证版本为0.13.0,转测后补充验证后续版本 - KVCache管理组件:目前仅支持mooncake(要求V1架构),已验证版本0.3.7,转测后补充验证后续版本 四、转测验收结果 要求 评估项 评估责任人 评估结果 备注 转测特性初验结果 按提供的资料操作能成功完成该版本安装、升级和调试。 <测试> 是/否/不涉及 <转测时不填> <转测时不填> 执行系统级测试用例,验收未发现严重及以上程度的特性质量问题 是/否/不涉及 <转测时不填> <转测时不填> 郑钦文 541293177@qq.com