登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
直播链接:https://www.hiascend.com/ascend-2026KADC/liveBroadcast/384b9de189f44221ac76591a680739f5
由 AtomGit 与昇腾(Ascend)联合举办的昇腾 Model-Agent 模型适配大赛正式开启,面向所有 AI 开发者、高校团队、企业技术爱好者,用 Agent 解锁模型适配新效率,实战拿奖、共建生态一步到位! 详情查看大赛官网:https://competition.gitcode.com/competition/2049738793226276866/intro &nbs
DeepSeek V4 定了 4 月下旬发布,但这次最大的看点不是万亿参数——而是推理跑在华为昇腾芯片上,推理不再依赖英伟达。三次跳票换来的是从 CUDA 到 CANN 的全栈迁移,开源 + 国产算力的组合在国内独一份。
摘要:本文提出AscendOptimizer系统,针对华为Ascend NPU的AscendC算子优化难题,通过双阶段交替优化方法实现性能提升。系统将算子拆分为host侧tiling program和device侧kernel program:Stage I采用进化搜索优化tiling策略,利用硬件反馈探索可行解空间;Stage II通过"优化回退"机制从优质kernel反向构
面向大模型工程化中的模型剪枝技术,提供可落地的轻量化方案。基于华为昇腾+NVIDIA Triton构建混合剪枝框架,支持LLM推理加速,在A100/Ascend 910场景下延迟直降63%。涵盖结构化剪枝、知识蒸馏与动态稀疏推理,兼顾精度与吞吐。值得收藏
破解大模型推理高能耗难题,提出量化×编译×调度三维协同优化路径。面向数据中心与边缘部署场景,融合INT4量化、图编译优化与动态负载调度,实测能效提升3.2倍。系统阐述大模型工程化中的能效优化策略,Meta与华为联合验证有效,值得收藏。
AtomGit模型托管指南:AI开发者的版本控制利器 摘要:本文介绍AtomGit平台针对AI开发者推出的模型托管与实验管理功能,解决传统Git无法有效管理大模型文件、实验参数分散等问题。AtomGit通过Git LFS大文件存储、模型卡片元数据记录、代码与模型版本关联等创新功能,实现AI项目的一体化管理。文章详细演示了如何创建模型仓库、配置Git LFS管理大文件、编写结构化模型卡片,并特别介绍
SITS2026专家:大模型推理加速硬件选型——聚焦GPU与NPU在LLM推理场景的实测对比,基于HBM带宽、INT4吞吐与能效比三大硬指标,TOP3芯片横向测评。覆盖数据中心与边缘部署需求,提供可落地的选型决策依据,值得收藏。
破解大模型算力成本黑洞,提供可落地的大模型工程化成本分摊与计费模型。面向GPU/TPU/NPU三级异构算力,公开弹性计费公式及12个生产调优参数,支持细粒度资源归因与多租户分摊。提升成本透明度与预算可控性,值得收藏。