一、层次化访问优化

1、Buffer访问优化

2、Shape对齐亲和计算,shape尽量采用32B对齐的shape

3、Buffer资源分配

二、计算资源利用优化

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐