26.06 【AI Inference】智能路由-cache-indexer重构优化 转测 | ||||||||
一、度量数据 | ||||||||
| 代码检视缺陷密度目标:16个/KLOC | 开发者测试缺陷密度目标:4个/KLOC | ||||||
责任人 | 代码类型 | 代码量(KLOC) | 有效缺陷数 | 检视缺陷密度(数量/代码量) | 说明(未达目标则需进行异常原因说明) | 发现缺陷数 | 缺陷密度(个/KLOC) | 说明(未达目标则进行异常原因说明) |
后台[16,13,19] 前台[13,10,16] | [4,2,8] | |||||||
郑钦文 | 后端 | 3.1 | 41 | 13.2 | / | 7 | 2.3 | / |
郑钦文 | 测试 | 2.5 | - | - | - | - | - | - |
二、特性转测checklist | ||||||||
要求 | 评估项 | 评估责任人 | 评估结果 | 备注 | ||||
完成了代码Review和开发自测,特性开发质量指标满足质量要求(或提供了合理的原因说明,或补充了质量活动) | 要求DT行覆盖率>50%; 推荐DT行覆盖率>80% | 郑钦文 | 是/否(覆盖率69.8%) | 计划转测后补充至80%+ | ||||
编译构建错误清零 | 是/否/不涉及 | / | ||||||
开源义务履行:SCA问题清零; | 是/否/不涉及 | / | ||||||
Issue解决:上版本遗留问题100%按计划解决;严重及以上问题清零; | 是/否/不涉及 | / | ||||||
设计完备性 | 提供社区需求设计文档链接:需求设计完成sig组内评审、遗留问题闭环; | 郑钦文 | 是/否/不涉及 | - 需求设计文档:《ofep-0053-cache-indexer重构增强》 https://gitcode.com/openFuyao/ofep/pull/82 - SIG评审:在AI Inference SIG 4/25例会完成评审 - 会议纪要:https://etherpad.openfuyao.cn/p/sig-ai-inference - 遗留问题闭环:已闭环,会议评审意见与修改见ofep评论区 | ||||
提供社区继承需求、新增需求完整清单; | 是/否/不涉及 | 本次为完整Go重构,原python版本无提案 | ||||||
提供特性级测试用例列表:需完成QA sig组评审和遗留问题闭环; | 是/否/不涉及 | 见邮件附件测试用例表格 - SIG评审:在AI Inference SIG 5/14例会完成评审 - 遗留问题闭环:已闭环。测试用例总数补充至48个,P0/P1用例数量调整至目标比例。 | ||||||
交付件完备性 | 提供交付件清单、未交付清单,及未交付件的未交付说明 | 郑钦文 | 是/否/不涉及 | - chart包:oci://cr.openfuyao.cn/charts/cache-indexer:0.0.0-latest - 镜像:or.openfuyao.cn/openfuyao/cache-indexer:latest - 代码仓库:https://gitcode.com/openFuyao/cache-indexer | ||||
提供特性描述文档、接口说明文档等测试支撑资料 | 是/否/不涉及 | 特性相关资料转测后补齐 | ||||||
功能完备性 | 提供本特性已交付需求/本次交付需求/未交付需求清单、及未交付需求的相关说明 | 郑钦文 | 是/否/不涉及 | 所属IR:智能路由 优化KVCache感知能力,新增路由策略强化NPU算力感知 特性SR:cache-indexer 项目重构优化,增加L3级别KVCache感知能力,tokenizer环节转移至智能路由 本次交付: 1. cache-indexer GO重构版本 2. kVCache感知: L1级能力重构,L3级能力新增 3. tokenizer环节转移到智能路由,命中率查询接口变更 未交付:无 | ||||
开发已完成该特性级需求基本功能验证,且验证结论为通过。 | 是/否/不涉及 | 特性级测试用例执行通过,且无严重及以上问题。 | ||||||
提供遗留问题清单,遗留问题需经过sig组评审通过 | 是/否/不涉及 | / | ||||||
测试完备性 | 特性级测试用例自动化率>80% | 郑钦文 | 是/否(覆盖率%) | 特性自动化测试用例转测后补齐 | ||||
三、测试关注 | ||||||||
测试建议 | cache-indexer使用指南见README:https://gitcode.com/openFuyao/cache-indexer/blob/master/README.md - 独立部署:支持独立部署,至少需要部署vLLM-ascend+mooncake master才可使用完整功能 - InferNex集成部署:InferNex/master分支已支持集成部署最新cache-indexer,端到端测试建议只开启智能路由(消费者)、cache-indexer以及inference-backend(vLLM-ascend 已包含mooncake); cache-indexer 规格: - 推理引擎:目前仅支持vLLM-ascend,已验证版本为0.13.0,转测后补充验证后续版本 - KVCache管理组件:目前仅支持mooncake(要求V1架构),已验证版本0.3.7,转测后补充验证后续版本 | |||||||
四、转测验收结果 | ||||||||
要求 | 评估项 | 评估责任人 | 评估结果 | 备注 | ||||
转测特性初验结果 | 按提供的资料操作能成功完成该版本安装、升级和调试。 | <测试> | 是/否/不涉及 <转测时不填> | <转测时不填> | ||||
执行系统级测试用例,验收未发现严重及以上程度的特性质量问题 | 是/否/不涉及 <转测时不填> | <转测时不填> | ||||||
participants (1)
-
郑钦文