体系结构论文(107):AscendOptimizer: Episodic Agent for Ascend NPU Operator Optimization
摘要:本文提出AscendOptimizer系统,针对华为Ascend NPU的AscendC算子优化难题,通过双阶段交替优化方法实现性能提升。系统将算子拆分为host侧tiling program和device侧kernel program:Stage I采用进化搜索优化tiling策略,利用硬件反馈探索可行解空间;Stage II通过"优化回退"机制从优质kernel反向构
所有评论(0)