[Qa] 26.03 【AI Inference】Infernex-一键式安装部署——离线部署转测

12 Mar 2026

      + 

26.03 【AI Inference】Infernex-一键式安装部署  转测

一、度量数据

代码检视缺陷密度目标：16个/KLOC

说明：代码提交前，通过检视发现的代码缺陷；

主要来源：PR中的comment；

导向：发现缺陷，积极提交comment，做到端到端可追溯

开发者测试缺陷密度目标：4个/KLOC

说明：代码提交后转测前，通过开发者测试发现的代码缺陷；

主要来源：转测前issue单（缺陷）

导向：发现缺陷，积极提交issue，做到无issue，不PR，端到端可追溯。

责任人

代码类型

代码量（KLOC）

有效缺陷数

检视缺陷密度(数量/代码量)

说明（未达目标则需进行异常原因说明）

发现缺陷数

缺陷密度（个/KLOC)

说明（未达目标则进行异常原因说明）

后台[16,13,19]

前台[13,10,16]

[4,2,8]

张仕畅

离线包制品

0

0

 0

离线包制品转测，不涉及代码

 0

 0

离线包转测，不涉及代码

二、特性转测checkli

要求

评估项

评估责任人

评估结果

备注

完成了代码Review和开发自测，特性开发质量指标满足质量要求（或提供了合理的原因说明，或补充了质量活动）

要求DT行覆盖率>50%；

推荐DT行覆盖率>80%

<开发>

是/否/不涉及

本特性为helm chart开发，不涉及UT/DT

编译构建错误清零

是/否/不涉及

开源义务履行：SCA问题清零；

是/否/不涉及

无SCA问题

Issue解决：上版本遗留问题100%按计划解决；严重及以上问题清零；

是/否/不涉及

设计完备性

提供社区需求设计文档链接：需求设计完成sig组内评审、遗留问题闭环；

<开发>

是/否/不涉及

《oFEP-0036-AI推理服务化框架组件端到端helm包一键部署》:
https://gitcode.com/openFuyao/ofep/pull/63

提供社区继承需求、新增需求完整清单；

是/否/不涉及

提供特性级测试用例列表：需完成QA sig组评审和遗留问题闭环；

是/否/不涉及

测试用例已在AI Inference SIG组会经过QA SIG成员评审通过，测试文件见附件表格

交付件完备性

提供交付件清单、未交付清单，及未交付件的未交付说明

<开发>

是/否/不涉及

已交付：

InferNex chart 包：
在线chart包地址：oci://cr.openfuyao.cn/charts/infernex:0.0.0-latest
仓库chart包地址：https://gitcode.com/openFuyao/InferNex

Proxy Server镜像：cr.openfuyao.cn/openfuyao/proxy-server:e1597b8087a76ffce896807fea6db46779323baf

cache indexer chart包
在线chart包地址：oci://cr.openfuyao.cn/charts/cache-indexer:0.0.0-latest
仓库chart包地址：https://gitcode.com/openFuyao/cache-indexer/tree/master/charts

本次交付：

 1. InferNex 离线部署

提供特性描述文档、接口说明文档等测试支撑资料

是/否/不涉及

特性资料交付用户手册，计划在转测后一周补齐

功能完备性

提供本特性已交付需求/本次交付需求/未交付需求清单、及未交付需求的相关说明

<开发>

是/否/不涉及

【IR20260107001378】InferNex一键式安装部署，提供端到端用户可选配置的一键部署能力

已交付：

1．【SR20260112627011】一键式部署，包含（智能路由、分布式KVCache管理、可观测、PD动态编排调度）以及部署完成后即能开箱使用推理服务的其他必要组件

2.  【SR20260112627104】开放提供各部署组件关键配置，使得在安装部署阶段即可选装部分开源第三方组件、配置关键功能选项

3.  【SR20260112625981】的【AR20260127018746】在线部署支持命令行一键部署、openFuyao管理面一键部署

本次交付：

1．【SR20260112625981】的【AR20260127014643】各组件离线功能代码适配

2.  【SR20260112625981】的【AR20260127012419】离线部署提供离线安装包，支持命令行一键部署、openFuyao管理面一键部署

开发已完成该特性级需求基本功能验证，且验证结论为通过。

是/否/不涉及

特性级测试用例通过，且无严重及以上问题。

测试结果详见附件表格

本次转测测试用例表格包含如下特性的测试用例：

InferNex离线集成部署用例

提供遗留问题清单，遗留问题需经过sig组评审通过

是/否/不涉及

1. https://gitcode.com/openFuyao/InferNex/issues/31

2. https://gitcode.com/openFuyao/InferNex/issues/29

3. https://gitcode.com/openFuyao/InferNex/issues/27

4. https://gitcode.com/openFuyao/InferNex/issues/24

测试完备性

特性级测试用例自动化率>80%

<开发>

覆盖率0%

离线部署评估准备条件太过复杂，离线包太大，不计划编写E2E自动化测试用例

三、测试关注

测试建议

1.离线部署要求用户将推理模型文件放置到指定模型缓存路径下，默认路径为 /home/llm_cache/huggingface/hub/。详细指导可以查看：https://gitcode.com/openFuyao/sig-ai-inference/blob/main/docs/zh/ai_inference_infernex/user_guide/ai_inference_infernex.md#自定义模型目录配置

2.InferNex默认部署的推理引擎是vllm-ascend v0.13.0，如果用户想要使用其他版本vllm-ascend，部分与引擎强相关的配置（如connector）需要参考vllm-ascend目标版本的文档配合改动。

3.InferNex默认部署模型为Qwen3-8B，且支持用户配置其他模型。模型通过hostpath方式挂载进运行容器，使用时需要确认宿主机有足够空间存放模型权重文件，特别是大模型。

4.因vllm-ascend使用模型名启动时的模型源需要是huggingface，使用时需要注意未在huggingface上的量化模型暂不支持。

四、转测验收结果

要求

评估项

评估责任人

评估结果

备注

转测特性初验结果

按提供的资料操作能成功完成该版本安装、升级和调试。

<测试>

是/否/不涉及

<转测时不填>
<转测时不填>

执行系统级测试用例，验收未发现严重及以上程度的特性质量问题

是/否/不涉及

<转测时不填>

<转测时不填>

欢迎大家对转测邮件、特性转测质量要求提出建议！

参考材料：组件上车特性质量要求 https://gitcode.com/openFuyao/sig-qa/blob/master/docs/%E7%BB%84%E4%BB%B6%E4%...

[Qa] 26.03 【AI Inference】Infernex-一键式安装部署——离线部署 转测

无言谁会凭栏意

[Qa] 26.03 【AI Inference】Infernex-一键式安装部署——离线部署转测