|
26.03 【AI Inference】Infernex-一键式安装部署 转测 |
|||||||||
|
一、度量数据 |
|||||||||
|
|
|
代码检视缺陷密度目标:16个/KLOC 说明:代码提交前,通过检视发现的代码缺陷; 主要来源:PR中的comment; 导向:发现缺陷,积极提交comment,做到端到端可追溯 |
开发者测试缺陷密度目标:4个/KLOC 说明:代码提交后转测前,通过开发者测试发现的代码缺陷; 主要来源:转测前issue单(缺陷) 导向:发现缺陷,积极提交issue,做到无issue,不PR,端到端可追溯。 |
||||||
|
责任人 |
代码类型 |
组件转测
|
代码量(KLOC) |
有效缺陷数 |
检视缺陷密度(数量/代码量) |
说明(未达目标则需进行异常原因说明) |
发现缺陷数 |
缺陷密度(个/KLOC) |
说明(未达目标则进行异常原因说明) |
|
后台[16,13,19] 前台[13,10,16] |
[4,2,8] |
||||||||
|
张仕畅 |
后端(Inference-backend) |
随InferNex转测
|
0.492 |
2 |
4 |
chart配置代码,较少检视缺陷 |
2 |
4 |
|
|
李乐奇
|
后端(Hermes-router & Inference-gateway) |
Hermes-router单独已转测,Inference-gateway随InferNex转测
|
5.498
|
7
|
1.3
|
大部分为三方包代码,进行集成配置修改
|
3
|
0.5
|
大部分为三方包代码,进行集成配置修改
|
|
许立
|
后端(orchestrator) |
组件单独已转测
|
0.072
|
3
|
42
|
配置集成代码简单,行数少
|
0
|
0
|
配置集成代码简单,行数少 |
|
朱雪仪
|
后端(eagle-eye) |
组件单独已转测
|
0.014
|
0
|
0
|
配置集成代码简单,行数少
|
0
|
0
|
配置集成代码简单,行数少 |
|
郑钦文
|
后端(cache-indexer) |
随InferNex转测
|
0.009
|
0
|
0
|
配置集成代码简单,行数少
|
0
|
0
|
配置集成代码简单,行数少 |
|
二、特性转测checklis |
|||||||||
|
要求 |
评估项 |
评估责任人 |
评估结果 |
备注 |
|||||
|
完成了代码Review和开发自测,特性开发质量指标满足质量要求(或提供了合理的原因说明,或补充了质量活动) |
要求DT行覆盖率>50%; 推荐DT行覆盖率>80% |
<开发> |
是/否/不涉及 |
本特性为helm chart开发,不涉及UT/DT |
|||||
|
编译构建错误清零 |
是/否/不涉及 |
|
|||||||
|
开源义务履行:SCA问题清零; |
是/否/不涉及 |
无SCA问题 |
|||||||
|
Issue解决:上版本遗留问题100%按计划解决;严重及以上问题清零; |
是/否/不涉及 |
|
|||||||
|
设计完备性 |
提供社区需求设计文档链接:需求设计完成sig组内评审、遗留问题闭环; |
<开发> |
是/否/不涉及 |
《oFEP-0036-AI推理服务化框架组件端到端helm包一键部署》: |
|||||
|
提供社区继承需求、新增需求完整清单; |
是/否/不涉及 |
|
|||||||
|
提供特性级测试用例列表:需完成QA sig组评审和遗留问题闭环; |
是/否/不涉及 |
测试用例已在AI Inference SIG组会经过QA SIG成员评审通过,测试文件见附件表格 |
|||||||
|
交付件完备性 |
提供交付件清单、未交付清单,及未交付件的未交付说明 |
<开发> |
是/否/不涉及 |
本次交付:
未交付: 1. InferNex chart离线包:计划在下一步转测 |
|||||
|
提供特性描述文档、接口说明文档等测试支撑资料 |
是/否/不涉及 |
特性资料交付用户手册,计划在转测后一周补齐 |
|||||||
|
功能完备性 |
提供本特性已交付需求/本次交付需求/未交付需求清单、及未交付需求的相关说明 |
<开发> |
是/否/不涉及 |
【IR20260107001378】InferNex一键式安装部署,提供端到端用户可选配置的一键部署能力(IR链接todo) 本次交付: 1.【SR20260112627011】一键式部署,包含(智能路由、分布式KVCache管理、可观测、PD动态编排调度)以及部署完成后即能开箱使用推理服务的其他必要组件 2. 【SR20260112627104】开放提供各部署组件关键配置,使得在安装部署阶段即可选装部分开源第三方组件、配置关键功能选项 3. 【SR20260112625981】的【AR20260127018746】在线部署支持命令行一键部署、openFuyao管理面一键部署 未交付: 1.【SR20260112625981】的【AR20260127014643】各组件离线功能代码适配 2. 【SR20260112625981】的【AR20260127012419】离线部署提供离线安装包,支持命令行一键部署、openFuyao管理面一键部署 |
|||||
|
开发已完成该特性级需求基本功能验证,且验证结论为通过。 |
是/否/不涉及 |
特性级测试用例通过,且无严重及以上问题。
测试结果详见附件表格
本次转测测试用例表格包含如下特性的测试用例:
其中离线部署测试用例验证在下一个离线部署需求转测中附带。
注意:InferNex的values.yaml中inference-backend.images.proxyServer.tag因proxy-server镜像因流水线未提供latest tag,需要手动配置为Infernex最新commit id,或配置为e1597b8087a76ffce896807fea6db46779323baf |
|||||||
|
提供遗留问题清单,遗留问题需经过sig组评审通过 |
是/否/不涉及 |
1. https://gitcode.com/openFuyao/InferNex/issues/31 2. https://gitcode.com/openFuyao/InferNex/issues/29 |
|||||||
|
测试完备性 |
特性级测试用例自动化率>80% |
<开发> |
覆盖率0% |
端到端自动化测试用例计划在转测后补齐 |
|||||
|
三、测试关注 |
|||||||||
|
测试建议 |
1.InferNex默认部署的推理引擎是vllm-ascend v0.13.0,如果用户想要使用其他版本vllm-ascend,部分与引擎强相关的配置(如connector)需要参考vllm-ascend目标版本的文档配合改动。 2.InferNex默认部署模型为Qwen3-8B,且支持用户配置其他模型。模型通过hostpath方式挂载进运行容器,使用时需要确认宿主机有足够空间存放模型权重文件,特别是大模型。 3.因vllm-ascend使用模型名启动时的模型源需要是huggingface,使用时需要注意未在huggingface上的量化模型暂不支持。 |
||||||||
|
四、转测验收结果 |
|||||||||
|
要求 |
评估项 |
评估责任人 |
评估结果 |
备注 |
|||||
|
转测特性初验结果 |
按提供的资料操作能成功完成该版本安装、升级和调试。 |
翁昊晚 |
是 |
特性级测试用例自动化率需进行后续跟踪,尽快达到80% |
|||||
|
执行系统级测试用例,验收未发现严重及以上程度的特性质量问题 |
是 |
|
|||||||
欢迎大家对转测邮件、特性转测质量要求提出建议!
participants (1)
-
翁 昊晚