在modelart上面陆陆续续微调了很多次,很久没有用了,上周忽然想到代金券快到期了,又上来搞了点实验,结果发现好像界面啥的优化了不少,稍微记录一下吧。

不过真要开始训练里面也有些坑

全流程我都截图了,有想预习一下的小伙伴也可以看一下

还是从ModelArts 的Notebook进去

下面有显示可以回到旧版,不习惯的可以回旧版

点击创建

时长可以自定义,最多72小时,后面可以随时改随时延长

选择镜像,就是这里和之前不太一样,以前就是个列表,看花眼,现在就是分好类了,而且如果专注于模型微调训练用官方这个MindSpeed LLM还是挺方便了,不过后面有个小坑。有自己的镜像的就不说了,用着方便就好。

然后是资源配置,除了前面的卡数,有两种后缀,1和3,区别就是单卡32G和单卡64G,当然价格不一样,按需取用。用什么配置其实前面也有一个帖子讲了。

磁盘规格,按需填,有一点点影响到价格,后面可以随时扩容。

下面是选了几个之后的价格的例子,可以做参考,这个是八卡*32G,一小时150多,一天3600多,如果是8卡*64G,一小时是250多,一天的价格,还是蛮贵的。预算紧缺的还是要安排好,最好不要浪费资源。训同一个模型其实可以有多种方案,可以选一个性价比高的。

选完就创建,然后就可以看到了,一开始是创建中,等几分钟创建好。

扩容啥的很简单

创建好了,就可以进入环境了。

这里就是自己选择notebook,比如我习惯了terminal

这个地址也稍微注意下,比如后面模型下载地址、调用地址啥的/home/ma-user/work/

看看资源:

这里是拿8*32G创建做了个演示,如果要训14B不做量化也不用deepspeed其实是不够的,还是要用单卡64G。

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐