主要步骤

  1. 获取昇腾服务器资源并登录

  2. 检查环境(Docker、NPU、网络)

  3. 准备推理镜像

    • 获取基础镜像
    • 获取授权软件包
    • 使用共享或自制镜像
  4. 准备模型权重文件

  5. 启动模型推理容器

  6. 在容器中启动在线推理服务

  7. 调用API验证模型

  8. 进行性能测试(静态与动态)

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐