26.03 【AI Inference】Infernex-一键式安装部署——离线部署转测

11 Mar 2026

      + 
26.03 【AI Inference】Infernex-一键式安装部署  转测
一、度量数据

代码检视缺陷密度目标：16个/KLOC
说明：代码提交前，通过检视发现的代码缺陷；
主要来源：PR中的comment；
导向：发现缺陷，积极提交comment，做到端到端可追溯 开发者测试缺陷密度目标：4个/KLOC
说明：代码提交后转测前，通过开发者测试发现的代码缺陷；
主要来源：转测前issue单（缺陷）
导向：发现缺陷，积极提交issue，做到无issue，不PR，端到端可追溯。
责任人 代码类型 代码量（KLOC） 有效缺陷数 检视缺陷密度(数量/代码量) 说明（未达目标则需进行异常原因说明） 发现缺陷数 缺陷密度（个/KLOC) 说明（未达目标则进行异常原因说明）
后台[16,13,19]
前台[13,10,16] [4,2,8]
张仕畅 离线包制品 0 0  0 离线包制品转测，不涉及代码  0  0 离线包转测，不涉及代码

二、特性转测checkli
要求 评估项 评估责任人 评估结果 备注
完成了代码Review和开发自测，特性开发质量指标满足质量要求（或提供了合理的原因说明，或补充了质量活动） 要求DT行覆盖率>50%；
推荐DT行覆盖率>80% <开发> 是/否/不涉及 本特性为helm chart开发，不涉及UT/DT
编译构建错误清零 是/否/不涉及  
开源义务履行：SCA问题清零； 是/否/不涉及 无SCA问题
Issue解决：上版本遗留问题100%按计划解决；严重及以上问题清零； 是/否/不涉及  
设计完备性 提供社区需求设计文档链接：需求设计完成sig组内评审、遗留问题闭环； <开发> 是/否/不涉及 《oFEP-0036-AI推理服务化框架组件端到端helm包一键部署》:
https://gitcode.com/openFuyao/ofep/pull/63
提供社区继承需求、新增需求完整清单； 是/否/不涉及 

提供特性级测试用例列表：需完成QA sig组评审和遗留问题闭环； 是/否/不涉及 测试用例已在AI Inference SIG组会经过QA SIG成员评审通过，测试文件见附件表格
交付件完备性 提供交付件清单、未交付清单，及未交付件的未交付说明 <开发> 是/否/不涉及 已交付：
InferNex chart 包：
在线chart包地址：oci://cr.openfuyao.cn/charts/infernex:0.0.0-latest
仓库chart包地址：https://gitcode.com/openFuyao/InferNex
Proxy Server镜像：cr.openfuyao.cn/openfuyao/proxy-server:e1597b8087a76ffce896807fea6db46779323baf
cache indexer chart包
在线chart包地址：oci://cr.openfuyao.cn/charts/cache-indexer:0.0.0-latest
仓库chart包地址：https://gitcode.com/openFuyao/cache-indexer/tree/master/charts
本次交付：
 1. InferNex 离线部署
提供特性描述文档、接口说明文档等测试支撑资料 是/否/不涉及 特性资料交付用户手册，计划在转测后一周补齐
功能完备性 提供本特性已交付需求/本次交付需求/未交付需求清单、及未交付需求的相关说明 <开发> 是/否/不涉及 【IR20260107001378】InferNex一键式安装部署，提供端到端用户可选配置的一键部署能力
已交付：
1．【SR20260112627011】一键式部署，包含（智能路由、分布式KVCache管理、可观测、PD动态编排调度）以及部署完成后即能开箱使用推理服务的其他必要组件
2.  【SR20260112627104】开放提供各部署组件关键配置，使得在安装部署阶段即可选装部分开源第三方组件、配置关键功能选项
3.  【SR20260112625981】的【AR20260127018746】在线部署支持命令行一键部署、openFuyao管理面一键部署
本次交付：
1．【SR20260112625981】的【AR20260127014643】各组件离线功能代码适配
2.  【SR20260112625981】的【AR20260127012419】离线部署提供离线安装包，支持命令行一键部署、openFuyao管理面一键部署
开发已完成该特性级需求基本功能验证，且验证结论为通过。 是/否/不涉及 特性级测试用例通过，且无严重及以上问题。

测试结果详见附件表格

本次转测测试用例表格包含如下特性的测试用例：
InferNex离线集成部署用例
提供遗留问题清单，遗留问题需经过sig组评审通过 是/否/不涉及 1.
https://gitcode.com/openFuyao/InferNex/issues/31
2.
https://gitcode.com/openFuyao/InferNex/issues/29
3.
https://gitcode.com/openFuyao/InferNex/issues/27
4.
https://gitcode.com/openFuyao/InferNex/issues/24
测试完备性 特性级测试用例自动化率>80% <开发> 覆盖率0% 离线部署评估准备条件太过复杂，离线包太大，不计划编写E2E自动化测试用例
三、测试关注
测试建议 1.离线部署要求用户将推理模型文件放置到指定模型缓存路径下，默认路径为 /home/llm_cache/huggingface/hub/。详细指导可以查看：https://gitcode.com/openFuyao/sig-ai-inference/blob/main/docs/zh/ai_inference_infernex/user_guide/ai_inference_infernex.md#自定义模型目录配置
2.InferNex默认部署的推理引擎是vllm-ascend v0.13.0，如果用户想要使用其他版本vllm-ascend，部分与引擎强相关的配置（如connector）需要参考vllm-ascend目标版本的文档配合改动。
3.InferNex默认部署模型为Qwen3-8B，且支持用户配置其他模型。模型通过hostpath方式挂载进运行容器，使用时需要确认宿主机有足够空间存放模型权重文件，特别是大模型。
4.因vllm-ascend使用模型名启动时的模型源需要是huggingface，使用时需要注意未在huggingface上的量化模型暂不支持。
四、转测验收结果
要求 评估项 评估责任人 评估结果 备注
转测特性初验结果 按提供的资料操作能成功完成该版本安装、升级和调试。 <测试> 是/否/不涉及
<转测时不填> <转测时不填>
执行系统级测试用例，验收未发现严重及以上程度的特性质量问题 是/否/不涉及
<转测时不填> <转测时不填>

欢迎大家对转测邮件、特性转测质量要求提出建议！
参考材料：组件上车特性质量要求
https://gitcode.com/openFuyao/sig-qa/blob/master/docs/%E7%BB%84%E4%BB%B6%E4%B8%8A%E8%BD%A6%E7%89%B9%E6%80%A7%E8%B4%A8%E9%87%8F%E8%A6%81%E6%B1%82.md

无言谁会凭栏意

tags

participants (1)

26.03 【AI Inference】Infernex-一键式安装部署转测
一、度量数据
			代码检视缺陷密度目标：16个/KLOC 说明：代码提交前，通过检视发现的代码缺陷；主要来源：PR中的comment；导向：发现缺陷，积极提交comment，做到端到端可追溯			开发者测试缺陷密度目标：4个/KLOC 说明：代码提交后转测前，通过开发者测试发现的代码缺陷；主要来源：转测前issue单（缺陷）导向：发现缺陷，积极提交issue，做到无issue，不PR，端到端可追溯。
责任人	代码类型	代码量（KLOC）	有效缺陷数	检视缺陷密度(数量/代码量)	说明（未达目标则需进行异常原因说明）	发现缺陷数	缺陷密度（个/KLOC)	说明（未达目标则进行异常原因说明）
					后台[16,13,19] 前台[13,10,16]			[4,2,8]
张仕畅	离线包制品	0	0	0	离线包制品转测，不涉及代码	0	0	离线包转测，不涉及代码
二、特性转测checkli
要求		评估项		评估责任人	评估结果	备注
完成了代码Review和开发自测，特性开发质量指标满足质量要求（或提供了合理的原因说明，或补充了质量活动）		要求DT行覆盖率>50%；推荐DT行覆盖率>80%		<开发>	是/否/不涉及	本特性为helm chart开发，不涉及UT/DT
		编译构建错误清零			是/否/不涉及
		开源义务履行：SCA问题清零；			是/否/不涉及	无SCA问题
		Issue解决：上版本遗留问题100%按计划解决；严重及以上问题清零；			是/否/不涉及
设计完备性		提供社区需求设计文档链接：需求设计完成sig组内评审、遗留问题闭环；		<开发>	是/否/不涉及	《oFEP-0036-AI推理服务化框架组件端到端helm包一键部署》: https://gitcode.com/openFuyao/ofep/pull/63
		提供社区继承需求、新增需求完整清单；			是/否/不涉及
		提供特性级测试用例列表：需完成QA sig组评审和遗留问题闭环；			是/否/不涉及	测试用例已在AI Inference SIG组会经过QA SIG成员评审通过，测试文件见附件表格
交付件完备性		提供交付件清单、未交付清单，及未交付件的未交付说明		<开发>	是/否/不涉及	已交付： InferNex chart 包：在线chart包地址：oci://cr.openfuyao.cn/charts/infernex:0.0.0-latest 仓库chart包地址：https://gitcode.com/openFuyao/InferNex Proxy Server镜像：cr.openfuyao.cn/openfuyao/proxy-server:e1597b8087a76ffce896807fea6db46779323baf cache indexer chart包在线chart包地址：oci://cr.openfuyao.cn/charts/cache-indexer:0.0.0-latest 仓库chart包地址：https://gitcode.com/openFuyao/cache-indexer/tree/master/charts 本次交付： 1. InferNex 离线部署
		提供特性描述文档、接口说明文档等测试支撑资料			是/否/不涉及	特性资料交付用户手册，计划在转测后一周补齐
功能完备性		提供本特性已交付需求/本次交付需求/未交付需求清单、及未交付需求的相关说明		<开发>	是/否/不涉及	【IR20260107001378】InferNex一键式安装部署，提供端到端用户可选配置的一键部署能力已交付： 1．【SR20260112627011】一键式部署，包含（智能路由、分布式KVCache管理、可观测、PD动态编排调度）以及部署完成后即能开箱使用推理服务的其他必要组件 2. 【SR20260112627104】开放提供各部署组件关键配置，使得在安装部署阶段即可选装部分开源第三方组件、配置关键功能选项 3. 【SR20260112625981】的【AR20260127018746】在线部署支持命令行一键部署、openFuyao管理面一键部署本次交付： 1．【SR20260112625981】的【AR20260127014643】各组件离线功能代码适配 2. 【SR20260112625981】的【AR20260127012419】离线部署提供离线安装包，支持命令行一键部署、openFuyao管理面一键部署
		开发已完成该特性级需求基本功能验证，且验证结论为通过。			是/否/不涉及	特性级测试用例通过，且无严重及以上问题。测试结果详见附件表格本次转测测试用例表格包含如下特性的测试用例： InferNex离线集成部署用例
		提供遗留问题清单，遗留问题需经过sig组评审通过			是/否/不涉及	1. https://gitcode.com/openFuyao/InferNex/issues/31 2. https://gitcode.com/openFuyao/InferNex/issues/29 3. https://gitcode.com/openFuyao/InferNex/issues/27 4. https://gitcode.com/openFuyao/InferNex/issues/24
测试完备性		特性级测试用例自动化率>80%		<开发>	覆盖率0%	离线部署评估准备条件太过复杂，离线包太大，不计划编写E2E自动化测试用例
三、测试关注
测试建议		1.离线部署要求用户将推理模型文件放置到指定模型缓存路径下，默认路径为 /home/llm_cache/huggingface/hub/。详细指导可以查看：https://gitcode.com/openFuyao/sig-ai-inference/blob/main/docs/zh/ai_inference_infernex/user_guide/ai_inference_infernex.md#自定义模型目录配置 2.InferNex默认部署的推理引擎是vllm-ascend v0.13.0，如果用户想要使用其他版本vllm-ascend，部分与引擎强相关的配置（如connector）需要参考vllm-ascend目标版本的文档配合改动。 3.InferNex默认部署模型为Qwen3-8B，且支持用户配置其他模型。模型通过hostpath方式挂载进运行容器，使用时需要确认宿主机有足够空间存放模型权重文件，特别是大模型。 4.因vllm-ascend使用模型名启动时的模型源需要是huggingface，使用时需要注意未在huggingface上的量化模型暂不支持。
四、转测验收结果
要求		评估项		评估责任人	评估结果	备注
转测特性初验结果		按提供的资料操作能成功完成该版本安装、升级和调试。		<测试>	是/否/不涉及 <转测时不填>	<转测时不填>
		执行系统级测试用例，验收未发现严重及以上程度的特性质量问题			是/否/不涉及 <转测时不填>	<转测时不填>