Innovation Project
OCINet 模型优化与国产化适配
面向钢铁/轨道表面缺陷检测,完成从文献调研、OCINet 模型理解、训练复现到 ONNX / OM 转换及 Ascend310B4 NPU 推理验证的国产化适配实践。
围绕钢铁/轨道表面缺陷检测开展文献调研,覆盖 EDRNet、EMINet、DACNet、CSEP、TSERNet、MINet、MCNet、NaDiNet 等缺陷检测与分割模型。
结项汇报聚焦“基于混合精度训练与昇腾 NPU 适配的 OCINet 模型优化研究”,梳理 PVTv2 编码器、SalReasoner 解码器及 CCIM/CSIM/CPIM 交互模块。
使用 PyTorch autocast 与 GradScaler 进行 AMP 混合精度训练,缓解本地 GPU 显存压力,为 8GB 显存条件下的训练与调参提供可行方案。
完成 ONNX 导出、ATC 转 OM、Ascend310B4 推理部署和 pyACL 批量推理脚本,实现从模型到国产化推理环境的工程验证。
Snapshot
验证数据
2086训练数据规模训练日志记录 Rail/2086 数据集加载成功,batch size 16,共 131 个 batch。
4.678s/张CPU 基线推理嵌入式 cpu.txt 记录 965 张数据集中前 30 张样本的 CPU 平均推理时间。
0.305s/张NPU / OM 推理ocinet.txt 记录 Ascend310B4 上 OM 模型推理,两个测试集日志均约 0.305 秒/张。
3.28 FPSNPU 日志 FPSpyACL 推理日志记录 NPU 测试 FPS 约为 3.28。
Timeline
推进过程
2024围绕钢铁表面缺陷检测与钢轨缺陷分割方向进行论文调研,建立项目问题域和模型对比基础。
2025理解并整理 OCINet 的 U 型结构、PVTv2 编码器、SalReasoner 解码器及多尺度交互模块。
2025 - 2026引入 AMP 混合精度训练流程,使用 autocast / GradScaler 处理显存瓶颈与训练稳定性问题。
2026.04完成本科生创新项目结项汇报,主题为 OCINet 模型优化与国产化适配。
2026在华为/昇腾开发环境中完成 ONNX 到 OM 的模型转换,并基于 pyACL 完成 Ascend310B4 推理验证。
Methods
方法与工具
OCINet用于显著目标检测/缺陷分割方向的模型结构,项目中围绕工业表面缺陷检测场景进行理解、优化和部署验证。
PVTv2作为编码器提取多尺度视觉特征,为后续缺陷区域推理和分割输出提供特征基础。
SalReasoner作为解码与推理模块,将编码特征转化为缺陷显著区域预测。
PyTorch AMP通过 autocast 与 GradScaler 进行混合精度训练,在本地 GPU 显存受限条件下提升训练可行性。
ONNX作为模型导出与跨框架部署的中间格式,用于后续昇腾工具链转换。
ATC昇腾模型转换工具,将 ONNX 模型转换为 Ascend310B4 可执行的 OM 模型。
Ascend310B4部署验证所使用的昇腾 NPU 目标芯片,项目围绕其完成国产化推理适配。
pyACL通过 AscendCL Python 接口加载 OM、分配设备内存、执行 H2D/D2H 拷贝、同步推理并保存结果。
Mermaid
技术路线
flowchart LR A[工业表面缺陷文献调研] --> B[OCINet 结构理解与源码梳理] B --> C[训练脚本与数据集配置] C --> D[AMP 混合精度训练] D --> E[ONNX 模型导出] E --> F[ATC 转换 OM 模型] F --> G[Ascend310B4 / CANN 环境配置] G --> H[pyACL 批量推理] H --> I[CPU 与 NPU 性能对照] I --> J[结项汇报与成果归档]
File Tree
相关文件
Gallery
模型图示与部署证据
Resources
相关文件
PDFOCINet 模型优化与国产化适配项目结项汇报
打开 →项目结项汇报 PDF 覆盖模型结构、混合精度训练、国产化适配与实验结果。
PPTXOCINet 模型优化与国产化适配项目结项汇报 PPTX
下载 →结项汇报演示文件,保留项目汇报页与答辩结构。
READMEOCINet 项目说明与复现实验入口
下载 →项目说明文档,记录模型名称、训练测试入口、评估方式与论文引用信息。
SOURCEOCINet 训练脚本
下载 →包含数据加载、BCE + IOU 损失、epoch / batch 日志、模型保存与 CUDA 训练配置。
SOURCEOCINet 模型结构代码
下载 →模型主体代码,支撑 PVTv2 编码器、多尺度交互与分割网络结构说明。
SOURCEPVTv2 Backbone 代码
下载 →OCINet 依赖的 PVTv2 主干网络实现文件。
SOURCEAscend NPU / pyACL 推理脚本
下载 →国产化推理脚本,包含 OM 模型加载、输入输出 buffer 分配、H2D/D2H 拷贝和模型执行逻辑。
LOGCPU 基线推理日志
下载 →记录 965 张数据集、30 张样本测试,CPU 平均推理约 4.678 秒/张,FPS 约 0.21。
LOGAscend310B4 / OM / pyACL 推理日志
下载 →记录 ATC 转换成功、Ascend310B4 适配、OM 推理测试,平均约 0.305 秒/张,FPS 约 3.28。
ENVNPU 环境启动说明
下载 →记录 conda 环境、Ascend Toolkit 环境变量与 NPU 测试命令。
ZIPNPU 部署材料包
下载 →NPU 侧部署材料包,包含部署脚本、日志、环境说明和相关图像材料。