Ascend(昇腾)性能优化文章导航
作者:昇腾实战派算力赋能时代,性能优化既是突破算力瓶颈的关键,也是国产化智能化转型的核心命题。本文聚焦昇腾设备全链路性能优化,汇总从硬件到软件,从算子到框架的实用干货,拆解调优技巧、分享实战案例、解答常见痛点。无论你是深耕昇腾的技术开发者,还是初探优化领域的初学者,都能在这里找到有价值的内容,一起解锁昇腾算力潜能,共探性能优化之道。
作者:昇腾实战派
算力赋能时代,性能优化既是突破算力瓶颈的关键,也是国产化智能化转型的核心命题。本文聚焦昇腾设备全链路性能优化,汇总从硬件到软件,从算子到框架的实用干货,拆解调优技巧、分享实战案例、解答常见痛点。无论你是深耕昇腾的技术开发者,还是初探优化领域的初学者,都能在这里找到有价值的内容,一起解锁昇腾算力潜能,共探性能优化之道。
一、基础知识
1.1 推理框架及其特性
【推理框架 - vLLM】:vLLM-Ascend模型推理知识管理地图
【推理框架 - SGLang】:SGLang知识地图
1.2 常用模型
【常用模型 - DeepSeek系列】:DeepSeek知识地图;DeepSeek推理部署知识地图
二、定位指导
【定位指导】性能问题通用定位指南
三、工具资源
【工具资源 - 环境预检工具】MindStudio预检工具 - msprechecker
【工具资源 - profiling采集工具】基于vllm-ascend的性能采集方法
【工具资源 - profiling分析工具】MindStudio-Insight
四、调优案例
4.1 推理案例
4.1.1 下发性能调优
【推理案例 - 下发性能调优】NPU推理性能优化实践:从CPU下发瓶颈到算子级调优
【推理案例 - 下发性能调优】Qwen3-32B 推理性能优化实践:基于绑核与NUMA内存调度的TTFT调优
4.1.2 计算性能调优
【推理案例 - 计算性能调优】模型Prefill阶段性能优化实践:从快慢卡问题到吞吐率提升
4.1.3 通信性能调优
…
昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链
更多推荐

所有评论(0)