登录社区云,与社区用户共同成长
邀请您加入社区
由于Resizer输入的模型其stride以及valid_shape均为动态,且模型性能与roi参数相关,需要用户提供真实的推理数据和roi信息。当前argmax节点的输出结构由于reshape在cast之后(如下图所示),因此无法直接通过remove_io_op删除cast,建议用户依据执行argmax操作维度的尺寸,在torch模型中将输出的index cast到对应数据类型再导出onnx/.
SparseBevFusionMultitaskOE是地平线征程6上的BEV多任务感知参考算法,包含动态检测、静态要素和占用格预测三个头。文章介绍了其模型结构、训练量化策略及部署优化建议。
文章系统分析了hbVPRoiResize接口的功能、ROI缩放规则及YUV场景下的硬件约束,通过案例解释了典型报错原因与修正方法。
本文针对算法模型在征程6芯片部署时的算子适配、效率和精度问题,提供了算子替换与优化方案,以提升模型运行性能。
本文演示了地平线征程6平台电源管理API的使用,包括启动标志读写、main域上下电、状态查询、复位、全系统下电及多种休眠唤醒场景的示例代码。
本文介绍了地平线征程6B计算平台的部署指南,涵盖硬件配置、工具链(PTQ/QAT)、模型转换、板端部署(UCP)及性能监测。
摘要 本文介绍了智能驾驶场景中多任务模型的优化部署方案。针对BEV动静态任务不同推理频率需求,分析了两种传统拆分方案的优缺点,提出利用工具链的link打包功能实现更优解决方案。该方案通过复用公共部分常量,将多个子模型打包为单一hbm文件,在保持模型体积接近的同时支持灵活调度不同任务分支的推理频率。
地平线征程6工具链UCP平台支持模型板端部署,提供图像获取、性能分析、优化工具及前后处理模块。
文章介绍了地平线征程6H/P平台的QAT量化调优流程,重点围绕int8+int16+fp16混合精度配置,详细阐述了模型检查、校准、训练和导出部署各阶段的调优原则、常见问题及解决方法。
本文为地平线PTQ实战指南,提供快速评测、校准部署、混合精度调优等步骤,帮助开发者高效优化模型性能与精度。